Résumé | On retrouve de plus en plus sur le World Wide Web des documents audio parlés, et cette tendance va sans doute s'accélérer, en raison du déploiement généralisé des technologies large bande. Malheureusement, les documents parlés sont difficiles à explorer, en raison de leur nature transitoire. Une approche de ce problème consiste à étiqueter les segments d'un document parlé au moyen de syntagmes clés qui les résument. Dans cet article, nous examinons une approche qui permet d'extraire automatiquement des syntagmes clés dans des documents audio parlés. Nous nous servons d'un système d'extraction de syntagmes clés (Extractor) développé à l'origine pour le texte, et l'appliquons à des transcriptions obtenues au moyen d'un système de reconnaissance de la parole, qui contiennent de nombreuses erreurs et peuvent comporter plusieurs hypothèses correspondant à chacun des énoncés. Nous démontrons que l'extraction de syntagmes clés est une tâche « plus facile » que la transcription intégrale du texte, et également que des syntagmes clés peuvent être extraits avec une précision raisonnable à partir de transcriptions dont le taux d'erreur sur les mots peut atteindre 62 %. Cette résistance aux parasites peut être attribuée au fait que les mots qui font partie de syntagmes clés correspondent à un taux d'erreur plus faible que les mots qui ne font pas partie d'un tel syntagme, et qu'ils ont tendance à présenter une redondance plus élevée dans l'audio. Nous en concluons que l'extraction de syntagmes clés est réalisable pour une grande variété de documents parlés, y compris pour la parole ordinaire, dont la qualité est en général inférieure à celle des textes qui sont diffusés. Nous démontrons également que le fait d'inclure plusieurs hypothèses sur l'énoncé n'améliore pas la précision des syntagmes clés extraits. |
---|