Automatic classification and indexing: a supplement

  1. (PDF, 1 Mo)
DOITrouver le DOI :
AuteurRechercher :
TypeRapport technique
Titre de collectionReport (National Research Council of Canada. Radio and Electrical Engineering Division : ERB); nº ERB-793
Description physique18 p.
RésuméThe occurrence of a word, one or more times, in a document is taken as an attribute of that document. Using a simple formula from Bayes probability, a probability is derived, based on that word, that the document belongs in a certain category. The procedure is applied to all the words of a document and the words are then ordered by probability to form a list. The procedure is also used to form category lists from existing categories although original categories could be formed. Document lists are compared to category lists and probability sums formed for indexing. Two sample category lists, derived from abstracts are given. Simple modifications show the ease of modifying list characteristics – two occurrences of a word, or occurrence in two documents being substituted for a single simple occurrence.
Date de publication
Maison d’éditionNational Research Council of Canada, Radio and Electrical Engineering Division
AffiliationConseil national de recherches Canada
Publications évaluées par des pairsNon
Numéro NPARC21277228
Exporter la noticeExport en format RIS
Signaler une correctionSignaler une correction
Identificateur de l’enregistrement8a11fe7a-f62e-4bad-9bcd-4b2ff50852e1
Enregistrement créé2016-01-14
Enregistrement modifié2017-03-27
Mettre en signet et diffuser
  • Partagez cette page avec Facebook (Ouvre dans une nouvelle fenêtre)
  • Partagez cette page avec Twitter (Ouvre dans une nouvelle fenêtre)
  • Partagez cette page avec Google+ (Ouvre dans une nouvelle fenêtre)
  • Partagez cette page avec Delicious (Ouvre dans une nouvelle fenêtre)
Date de modification :