Le Modèle de Markov Caché principal
Ce modèle représente la totalité du vocabulaire de l'application et il est composé de trois niveaux :
- Le niveau mot : chaque état du MMC représente la graphie d'un mot.
Notre système travaillant dans un contexte de mots isolés, les mots seront encadrés de silences.
- Le niveau phonétique : chaque état de ce niveau réfère à une unité phonétique, c'est-à-dire les
classes majeures dans ce cas. Les transitions probabilisées décrivent la décomposition phonétique des
mots du niveau supérieur.
Pour minimiser le problème d'accès posé par la reconnaissance grands vocabulaires,
le corpus à ce niveau est structuré de manière arborescente. Les formes qui ont la même représentation
phonologique en classes majeures sont factorisées, les branches de l'arbre correspondant sont regroupées
en une seule.
- Le niveau acoustique : l'ensemble des états et transitions de ce niveau correspond aux modèles acoustiques
des classes majeures du niveau phonétique. Chaque classe majeure du niveau supérieur est remplacée par son modèle
acoustique pré-défini.
Les transitions supportent des lois d'observations gaussiennes avec des matrices de convergence diagonales.
L'algorithme de Viterbi cherchera à aligner les observations dans ce niveau.
Un lien de parenté de type "père/fils" est créé entre les états de deux niveaux adjacents.
Ainsi, l'état référant à la graphie "ma" au niveau mot possède un lien de parenté avec les états
désignant les classes majeures N et A au niveau inférieur, ceux-ci représentant sa décomposition phonétique.
Suivant le même principe, ces états seront liés aux états du troisième niveau représentant leur décomposition acoustique.
Extrait du MMC principal pour le mot "ma"
Etant donné la;possibilité d'avoir plusieurs mots pour une même suite de classes majeures
et la structure arborescente du niveau phonétique, un état référant à une classe majeure peut
avoir plusieurs pères.
Extrait du MMC principal pour des états ayant plusieurs pères
Octobre 1994.