Résumé:
Les premières approches de la recherche d’information dans un contenu parlé ont d’abord
utilisé des techniques similaires à celle développées pour les documents textuels, appliquées à
la transcription automatique du flux de parole. Un système de reconnaissance automatique de
la parole est appliqué à un ensemble de fichiers audio et génère une transcription de la parole.
Cette transcription est alors indexée et une recherche est alors lancée par un système de
recherche. Le résultat fourni pour une requête est une liste de pointeurs vers des fichiers
audio.
En détection de mots clés, le but est de reconnaître les mots clés dans un flux de parole
continue, indépendamment du locuteur. La détection de mots clés résout quelques problèmes
liés à la reconnaissance de la parole continue comme les hésitations, les faux départs, les
phrases grammaticalement incorrectes, les phrases tronquées, etc.
Dans ce mémoire, nous avons proposé une approche qui peut être considérée comme une
autre voie que la transcription textuelle des discours en vue de l’exploitation des bases de
données audio, en offrant une méthode qui se fonde principalement sur le signal acoustique
avant sa transcription phonétique.
Nous avons proposé une méthode qui tente de localiser un mot clef dans un flux audio en se
basant sur la détection de certaine de ses caractéristiques. Ainsi, la détection d’un mot clef est
réalisée par la détection d’un son particulier dans le mot c'est-à-dire d’une unité infra-lexicale,
et à partir de cet « ilot de confiance », on peut chercher dans l’intervalle considéré le mot à
reconnaître. Lorsque ces unités sont détectées dans le discours un appariement avec les
modèles des mots clefs qui contiennent ces unités est effectué.
L’évaluation de cette approche est faite sur la langue arabe, langue où peu de travaux ont été
menés aussi bien en reconnaissance de la parole qu’en recherche d’information