Téléchargement | - Voir le manuscrit accepté : Text categorization for an online tendering system (PDF, 573 Kio)
|
---|
Auteur | Rechercher : Wang, Y.; Rechercher : Zhang, H.; Rechercher : Spencer, B.1; Rechercher : Yan, Y.1 |
---|
Affiliation | - Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
|
---|
Format | Texte, Article |
---|
Conférence | Business Agents and Semantic Web Workshop (BASeWEB 04), May 2004, London, Canada |
---|
Sujet | text categorization; machine learning; Rocchio method; TF-IDF; WIDF; weighted inverse document frequency; naive Bayes classifier; ranking categorization |
---|
Résumé | This paper investigates the application of text categoriza- tion (TC) in a setting exhibiting a large number of target categories with relatively few training cases, applied to a real-life online tendering system. This is an experiment paper showing our experiences in dealing with a real- life application using the conventional machine learning approaches for TC, namely, the Rocchio method, TF-IDF (term frequency-inverse document fre- quency), WIDF (weighted inverse document frequency), and naijve Bayes. In order to make the categorization results acceptable for industrial use, we made use of the hierarchical structure of the target categories and investi- gated the semi-automated ranking categorization. |
---|
Date de publication | 2004-05-01 |
---|
Dans | |
---|
Langue | anglais |
---|
Publications évaluées par des pairs | Oui |
---|
Numéro NPARC | 21260516 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | a3b8b396-a184-43b9-b229-d47c4e95ed5c |
---|
Enregistrement créé | 2013-03-05 |
---|
Enregistrement modifié | 2020-06-04 |
---|