Un outil informatique de gestion de Modèles de Markov Cachés : expérimentations en Reconnaissance Automatique de la Parole
- Glossaire
- Introduction
- Chapitre I : Reconnaissance automatique de la parole
- I . 1 . Principaux outils et méthodes utilisés en R.A.P
- I . 1 . 1 . La paramétrisation du signal
- A) A partir du modèle de perception
- B) Les méthodes non paramétriques
- C) Les méthodes paramétriques
- D) Les Coefficients Cepstraux
- I . 1 . 2 . Méthodes
- A) Méthodes à base de connaissances
- B) Méthodes auto-organisatrices
- A) LA COMPARAISON DYNAMIQUE
- B) LES MODèLES DE MARKOV CACHéS
- A) Modèle théorique
- B) Utilisation des MMC en RAP
- C) Phase de reconnaissance
- D) Apprentissage d'un MMC
- C) LES RéSEAUX DE NEURONES
- A) Fonctionnement d'un neurone
- B) Fonctionnement d'un réseau de neurones à plusieurs niveaux
- C) Apprentissage d'un réseau de neurones
- D) Phase de reconnaissance
- I . 2 . 3 . Conclusion
- I . 2 . Reconnaissance pour de grands vocabulaires
- I . 3 . Les modèles de langage
- I . 4 . Description de quelques systèmes de RAP
- I . 4 . 1 . Modules de décodage acoustico-phonétique (DAP)
- I . 4 . 2 . Reconnaissance de mots isolés
- I . 4 . 3 . Reconnaissance de mots connectés
- I . 4 . 4 . Reconnaissance de parole continue
- I . 5 . Extension des Modèles de Markov Cachés
- I . 5 . 1 . Traitement segmental
- I . 5 . 2 . Modélisation de la durée
- I . 5 . 3 . Modèles hybrides
- I . 5 . 4 . Modèles de fusion
- I . 6 . Cadre de l'étude
- Chapitre II : L'outil informatique
- II . 1 . Introduction
- II . 2 . Les réseaux élémentaires
- II . 3 . Gestion de réseaux
- II . 3 . 1 . Gestion de réseaux "locaux"
- II . 3 . 2 . Gestion de réseaux "externes"
- II . 4 . Interprétation de règles phonologiques
- A) Les Clusters
- B) Les Coarticulations
- II . 5 . Particularités des réseaux générés
- II . 5 . 1 . Multi-niveaux
- II . 5 . 2 . Construction d'un niveau en arbre
- II . 5 . 3 . Construction d'ensembles d'états
- II . 5 . 4 . Initialisation des lois de probabilités
- II . 5 . 5 . Optimisation du réseau
- II . 6 . Multi-Gaussiennes
- II . 7 . Multi-Modèles
- II . 8 . Les algorithmes
- II . 8 . 1 . L'algorithme de Viterbi
- II . 8 . 2 L'apprentissage
- II . 8 . 3 . La reconnaissance
- A) Reconnaissance classique
- B) Reconnaissance ensembliste
- II . 9 . Conclusion sur le compilateur
- Chapitre III : Applications
- Chapitre III - Section A : Filtrage lexical
- III_A . 1 . Présentation générale du système
- III_A . 2 . Description du pré-traitement acoustique
- III_A . 2 . 1 . La segmentation
-
- A) DESCRIPTION DE LA MéTHODE DE DIVERGENCE
- B) LE TEST DE DIVERGENCE
- C) LA MéTHODE FORWARD-BACKWARD
- III_A . 2 . 2 . Extraction des paramètres
- III_A . 3 . Filtrage lexical
- III_A . 3 . 1 . Description du lexique
- A ) LE LEXIQUE BDLEX
- B ) DéFINITION DES CLASSES MAJEURES
- III_A . 3 . 2 . Sélection d'un sous-dictionnaire
- III_A . 4 . Description de la phase de reconnaissance fine
- III_A . 4 . 1 . Description des pseudo-diphones
- III_A . 4 . 2 . Reconnaissance d'un mot
- III_A . 5 . Expérimentations
- III_A . 5 . 1 Application
- III_A . 5 . 2 Conditions d'expérimentations
- III_A . 5 . 3 Résultats
- A) EXPéRIMENTATIONS SUR LES CLASSES MAJEURES
- 1 ) Expérimentation sur 50 mots
- 2 ) Expérimentation sur 500 mots
- B) EXPéRIMENTATIONS SUR LES PSEUDO-DIPHONES
- III_A . 6 . Conclusion sur le filtrage lexical
- Chapitre III - Section B : Modèle Maître - Esclave
- III_B . 1 . Introduction
- III_B . 2 . Principe du modèle théorique
- III_B . 3 . Modèle équivalent
- * Hypothèses simplificatrices
- * Mise en oeuvre
- III_B . 4 . Expérimentations
- * Pré-traitement des données
- * Données
- * Résultats
- A] RéSULTATS EN MILIEU NON BRUITé
- a) Résultats sur le corpus des chiffres
- b) Résultats sur le corpus des lettres
- c) Résultats d'une reconnaissance sans connaissance du nombre de lettres
- B] RéSULTATS EN MILIEU BRUITé à 15 DB
- a) Reconnaissance en milieu bruité avec le modèle Global
- b) Reconnaissance en milieu bruité avec le modèle Maître-Esclave
- III_B . 5 . Conclusion sur le modèle Maître-Esclave
- Chapitre III - Section C : Evaluation d'un module de décodage acoustico-phonétique
- III_C . 1 . Décodage acoustico-phonétique et alignement automatique.
- * Le système de D.A.P. :
- * L'alignement phonétique:
- III_C . 2 . Apprentissage des modèles acoustiques et construction de la phrase markovienne
- III_C . 3 . Résultats :
- Chapitre III - Section D : Post - Traitement en reconnaissance automatique de parole
- III_D . 1 . Principe
- III_D . 2 . Extraction des MMC segmentaux :
- III_D . 3 . Expérimentations :
- * Données :
- * Expérimentations :
- Chapitre IV : Conclusion et Perspectives
- IV . 1 . Conclusion
- IV . 2 . Perspectives
- IV . 2 . 1 . Modèles parallèles :
- IV . 2 . 2 . Algorithmes pour réseaux multi-niveaux compilés :
- IV . 2 . 3. Algorithmes pour réseaux multi-niveaux non compilés :
- IV . 2 . 4 . Cohérence de l'ensemble des outils.
- Références
- Annexe : exemple de modélisation