Reconnaissance vocale et spectrogramme
Posté : dim. 9 déc. 2012 21:26
Bonsoir,
J'ai un exercice à faire pour la spé, sur lequel je bloque :
"La voix peut être décomposée en une suite de sons distinctifs appelés phonèmes. Les mots "lait" et "loup", par exemple, diffèrent par un phonème respectivement repété en alphabet phonétique par [[smb]epsilon[/smb]] et . Le repérage des phonèmes est l'une des étapes de la reconnaissance vocale. Le spectre du son correspondant à un phonème fait apparaître plusieurs pics appelés formants (doc. 1). Ils sont dus à des phénomènes de résonance à l'intérieur du conduit vocal; leur fréquence dépend de la position des divers organes mis en jeu dans la voix (langues, lèvres, etc.). Les formants sont caractéristiques du phonème prononcé. Sur un spectrogramme, les formants sont repérés par des zones plus sombres (doc. 2), car les intensités sonores correspondantes sont plus importantes. Les analyses spectrales montrent que quatre à cinq formants importants sont présents dans tous les psectres de voix. Le spectre en fréqunces et le spectrogramme de la voyelle "è" sont donnés dans les documents 1 et 2. Cinq formants, notés F1, F2, F3, F4 et F5, ont été repérés. Le document 3 est le spectrogramme obtenu lors de la prononciation de quatre phonèmes : "i", "è", "o" et "ou" notés phonétiquement , [[smb]epsilon[/smb]], [o] et . Le document 4 est le spectrogramme de quatre mots contenant les voyelles précédentes : "lit", "lait", "lot" et "loup". Ces quatre mots sont dans le désordre et sont repérés par des lettres de A à D."
"Question : Identifier les mots "lit", "lait", "lot" et "loup" dans le spectrogramme du document 4."
C'est la première fois que je dois analyser un spectrogramme donc du coup je suis un peu perdu ^^'.
Je ne suis pas sur d'avoir tout saisi en fait mais j'ai tout de même une piste (bien que je ne sais pas vraiment comment l'expliquer pour résoudre le problème). Dans le doc 2, on dirait que les formants correspondent non seulement aux bandes rouges foncées, mais également aux vertes/turquoises. Ces dernières se retrouvent dans le spectrogramme des voyelles o (deux bandes vertes) et ou (une seule) du doc 3. Si ma piste est bonne, alors dans le doc 4, la lettre A (deux bandes turquoises) correspondrait à un mot contenant la voyelle o, soit "lot" et la lettre C (une bande turquoise) à "loup". Mais même si j'ai juste, je ne vois pas qu'est ce qui me permet d'identifier les lettres B et D...
Je m'excuse pour la qualité des documents, mais vous devriez percevoir les couleurs en zoomant normalement.
Je vous remercie d'avance. :)
J'ai un exercice à faire pour la spé, sur lequel je bloque :
"La voix peut être décomposée en une suite de sons distinctifs appelés phonèmes. Les mots "lait" et "loup", par exemple, diffèrent par un phonème respectivement repété en alphabet phonétique par [[smb]epsilon[/smb]] et . Le repérage des phonèmes est l'une des étapes de la reconnaissance vocale. Le spectre du son correspondant à un phonème fait apparaître plusieurs pics appelés formants (doc. 1). Ils sont dus à des phénomènes de résonance à l'intérieur du conduit vocal; leur fréquence dépend de la position des divers organes mis en jeu dans la voix (langues, lèvres, etc.). Les formants sont caractéristiques du phonème prononcé. Sur un spectrogramme, les formants sont repérés par des zones plus sombres (doc. 2), car les intensités sonores correspondantes sont plus importantes. Les analyses spectrales montrent que quatre à cinq formants importants sont présents dans tous les psectres de voix. Le spectre en fréqunces et le spectrogramme de la voyelle "è" sont donnés dans les documents 1 et 2. Cinq formants, notés F1, F2, F3, F4 et F5, ont été repérés. Le document 3 est le spectrogramme obtenu lors de la prononciation de quatre phonèmes : "i", "è", "o" et "ou" notés phonétiquement , [[smb]epsilon[/smb]], [o] et . Le document 4 est le spectrogramme de quatre mots contenant les voyelles précédentes : "lit", "lait", "lot" et "loup". Ces quatre mots sont dans le désordre et sont repérés par des lettres de A à D."
"Question : Identifier les mots "lit", "lait", "lot" et "loup" dans le spectrogramme du document 4."
C'est la première fois que je dois analyser un spectrogramme donc du coup je suis un peu perdu ^^'.
Je ne suis pas sur d'avoir tout saisi en fait mais j'ai tout de même une piste (bien que je ne sais pas vraiment comment l'expliquer pour résoudre le problème). Dans le doc 2, on dirait que les formants correspondent non seulement aux bandes rouges foncées, mais également aux vertes/turquoises. Ces dernières se retrouvent dans le spectrogramme des voyelles o (deux bandes vertes) et ou (une seule) du doc 3. Si ma piste est bonne, alors dans le doc 4, la lettre A (deux bandes turquoises) correspondrait à un mot contenant la voyelle o, soit "lot" et la lettre C (une bande turquoise) à "loup". Mais même si j'ai juste, je ne vois pas qu'est ce qui me permet d'identifier les lettres B et D...
Je m'excuse pour la qualité des documents, mais vous devriez percevoir les couleurs en zoomant normalement.
Je vous remercie d'avance. :)