Analyse des Formants dans un Spectre de Parole
Comprendre les Formants
La parole humaine est produite par une source (les vibrations des cordes vocales) qui génère un son riche en harmoniques. Ce son est ensuite filtré par le conduit vocal (gorge, bouche, nez). Les résonances de ce conduit amplifient certaines bandes de fréquences : ces pics d'énergie dans le spectre du son sont appelés formants. La position en fréquence des deux premiers formants, F1 et F2, est particulièrement importante car elle détermine la voyelle que nous percevons. En modifiant la forme de notre bouche et la position de notre langue, nous changeons les résonances du conduit et donc les fréquences des formants, nous permettant de passer d'une voyelle à une autre.
Données de l'étude
- Un premier pic d'énergie (F1) est centré autour de 300 Hz.
- Un deuxième pic d'énergie (F2) est centré autour de 2300 Hz.
- Un troisième pic (F3) est visible vers 2900 Hz.
Voyelle | F1 (Hz) | F2 (Hz) |
---|---|---|
[i] (si) | 270 | 2290 |
[a] (pas) | 730 | 1090 |
[u] (sou) | 300 | 870 |
Schéma : Spectre d'une Voyelle
Spectre de puissance d'un son de voyelle, montrant les pics d'énergie qui correspondent aux formants F1, F2 et F3.
Questions à traiter
- Identifier les fréquences des deux premiers formants, F1 et F2, à partir des données de l'étude.
- Comparer les valeurs de F1 et F2 mesurées avec la table de référence des voyelles.
- Identifier la voyelle la plus probable qui a été prononcée.
- Expliquer brièvement la position de la langue pour produire cette voyelle, en se basant sur les fréquences de F1 et F2.
Correction : Analyse des formants dans un spectre de parole
Question 1 : Identification des Fréquences F1 et F2
Principe :
Les formants sont les pics d'énergie dans le spectre. Il suffit de lire les fréquences correspondant aux deux premiers pics mentionnés dans les données.
Analyse :
D'après les données de l'étude :
- Le premier pic est à \(F_1 = 300 \, \text{Hz}\).
- Le deuxième pic est à \(F_2 = 2300 \, \text{Hz}\).
Question 2 : Comparaison à la Table de Référence
Principe :
On compare le couple (F1, F2) obtenu à ceux listés dans la table pour chaque voyelle afin de trouver la correspondance la plus proche.
Comparaison :
- Voyelle [i] (si) : \(F_1 \approx 270\) Hz, \(F_2 \approx 2290\) Hz.
- Voyelle [a] (pas) : \(F_1 \approx 730\) Hz, \(F_2 \approx 1090\) Hz.
- Voyelle [u] (sou) : \(F_1 \approx 300\) Hz, \(F_2 \approx 870\) Hz.
Nos valeurs mesurées (\(F_1=300\) Hz, \(F_2=2300\) Hz) sont très proches de celles de la voyelle [i].
Question 3 : Identification de la Voyelle
Conclusion :
La combinaison d'un premier formant très bas (\(F_1=300\) Hz) et d'un deuxième formant très haut (\(F_2=2300\) Hz) est la signature acoustique caractéristique de la voyelle [i] (comme dans le mot "si" ou "vie").
Question 4 : Position de la Langue pour la Voyelle [i]
Analyse :
Les fréquences des formants sont directement liées à la géométrie du conduit vocal :
- Le premier formant (F1) est inversement corrélé à la hauteur de la langue. Un F1 bas (comme 300 Hz) signifie que le corps de la langue est très haut dans la bouche.
- Le deuxième formant (F2) est corrélé à la position avant/arrière de la langue. Un F2 haut (comme 2300 Hz) signifie que le corps de la langue est très avancé dans la bouche, vers les dents.
Par conséquent, pour produire la voyelle [i], le locuteur place sa langue très haut et très en avant dans sa bouche, ne laissant qu'un petit canal pour le passage de l'air.
Quiz Rapide : Testez vos connaissances
1. Un son avec un F1 élevé et un F2 bas correspondrait probablement à quelle voyelle ?
2. Le timbre d'un instrument de musique est principalement déterminé par...
Glossaire
- Formant
- Fréquence de résonance du conduit vocal. Les pics d'énergie dans le spectre d'une voyelle correspondent aux formants. Les deux premiers formants (F1 et F2) sont les plus importants pour distinguer les voyelles entre elles.
- Spectre de Parole
- Représentation de l'amplitude (ou de l'énergie) des différentes fréquences qui composent un son de parole à un instant donné.
- Modèle Source-Filtre
- Modèle de la production de la parole qui sépare le processus en deux parties : une source (les cordes vocales créant un son de base) et un filtre (le conduit vocal qui modifie ce son).
- Espace F1-F2
- Graphique où chaque voyelle est représentée par un point dont les coordonnées sont les fréquences de ses deux premiers formants (F1 sur l'axe des ordonnées, F2 sur l'axe des abscisses). Il permet de visualiser le "triangle vocalique".
D’autres exercices de Bioacoustique:
0 commentaires