L'objet du projet BDLEX ( base de données et de connaissance lexicales du français écrit et parlé ) est de fournir aux usagers, travaillant dans le domaine du traitement automatique de la parole et des textes, des matériaux lexicaux et un ensemble d'outils linguistiques. D'autres utilisations sont envisagées comme par exemple la sélection de corpus de tests en neuropsycholinguistique. Au cours de mon stage, j'ai réalisé un programme de consultation, dans un premier temps, afin de rendre plus facile l'accès des informations, stockées sur leur poste de travail, aux neuropsycholinguistes par le biais d'Hypercard. Ensuite, les recensements du neuropsycholinguiste Baudot m'ont permis d'augmenter la base de données BDLEX avec l'attribut de référence d'usage des mots. J'ai pu terminer ce stage en implantant sous ORACLE/SUN des demandes d'informations émanant des neuropsycholinguistes en complétant la base de données existante par de nouveaux attributs au moyen de programmes écrits en Pro*C.
Mes travaux de thèse portent sur la conception d'un outil informatique dédié à la gestion de modèles de Markov cachés dans le cadre de la Reconnaissance Automatique de la Parole ( RAP ).
A l'heure actuelle, les modules classiques de RAP les plus efficaces utilisent une approche statistique et plus particulièrement des Modèles de Markov Cachés ( MMC ). Il en existe une grande diversité et les recherches autour de ces modèles sont nombreuses. Posséder un outil suffisamment souple, permettant d'accéder aux différents niveaux d'abstraction de ces modèles, est un réel besoin en recherche fondamentale sur la reconnaissance automatique de la parole. Afin d'apporter une aide dans la conception de systèmes de reconnaissance basés sur la notion de réseau probabilisé, nous avons conçu un outil permettant de compiler des réseaux multi-niveaux à partir d'un langage de compilation simple et contenant le moins de contraintes possible. Cet outil est modulable et rapidement adaptable à de nouveaux besoins sans être nécessairement expert en informatique. Nous avons réalisé deux principales applications dans le cadre de la reconnaissance automatique de parole afin d'évaluer cet outil :
Pour plus de détails sur mes travaux de thèse, on peut se référer au document de thèse ou au résumé de mes activités de recherche.
.
Mai 2001