Analyse des Formants dans un Spectre de Parole

Analyse des Formants dans un Spectre de Parole

Analyse des Formants dans un Spectre de Parole

Comprendre les Formants

La parole humaine est produite par une source (les vibrations des cordes vocales) qui génère un son riche en harmoniques. Ce son est ensuite filtré par le conduit vocal (gorge, bouche, nez). Les résonances de ce conduit amplifient certaines bandes de fréquences : ces pics d'énergie dans le spectre du son sont appelés formants. La position en fréquence des deux premiers formants, F1 et F2, est particulièrement importante car elle détermine la voyelle que nous percevons. En modifiant la forme de notre bouche et la position de notre langue, nous changeons les résonances du conduit et donc les fréquences des formants, nous permettant de passer d'une voyelle à une autre.

Données de l'étude

On analyse un spectre de parole simplifié, correspondant à la prononciation d'une voyelle. Le spectre montre plusieurs pics d'énergie correspondant aux formants.

Données du spectre (voir schéma) :

  • Un premier pic d'énergie (F1) est centré autour de 300 Hz.
  • Un deuxième pic d'énergie (F2) est centré autour de 2300 Hz.
  • Un troisième pic (F3) est visible vers 2900 Hz.

Table de référence des voyelles (pour un locuteur masculin moyen) :

Voyelle F1 (Hz) F2 (Hz)
[i] (si)2702290
[a] (pas)7301090
[u] (sou)300870
Schéma : Spectre d'une Voyelle
Fréquence (Hz) Amplitude (dB) 500 1k 2k 3k 4k F1 F2 F3

Spectre de puissance d'un son de voyelle, montrant les pics d'énergie qui correspondent aux formants F1, F2 et F3.


Questions à traiter

  1. Identifier les fréquences des deux premiers formants, F1 et F2, à partir des données de l'étude.
  2. Comparer les valeurs de F1 et F2 mesurées avec la table de référence des voyelles.
  3. Identifier la voyelle la plus probable qui a été prononcée.
  4. Expliquer brièvement la position de la langue pour produire cette voyelle, en se basant sur les fréquences de F1 et F2.

Correction : Analyse des formants dans un spectre de parole

Question 1 : Identification des Fréquences F1 et F2

Principe :

Les formants sont les pics d'énergie dans le spectre. Il suffit de lire les fréquences correspondant aux deux premiers pics mentionnés dans les données.

Analyse :

D'après les données de l'étude :

  • Le premier pic est à \(F_1 = 300 \, \text{Hz}\).
  • Le deuxième pic est à \(F_2 = 2300 \, \text{Hz}\).
Résultat Question 1 : Les fréquences des deux premiers formants sont \(F_1 = 300\) Hz et \(F_2 = 2300\) Hz.

Question 2 : Comparaison à la Table de Référence

Principe :

On compare le couple (F1, F2) obtenu à ceux listés dans la table pour chaque voyelle afin de trouver la correspondance la plus proche.

Comparaison :
  • Voyelle [i] (si) : \(F_1 \approx 270\) Hz, \(F_2 \approx 2290\) Hz.
  • Voyelle [a] (pas) : \(F_1 \approx 730\) Hz, \(F_2 \approx 1090\) Hz.
  • Voyelle [u] (sou) : \(F_1 \approx 300\) Hz, \(F_2 \approx 870\) Hz.

Nos valeurs mesurées (\(F_1=300\) Hz, \(F_2=2300\) Hz) sont très proches de celles de la voyelle [i].

Question 3 : Identification de la Voyelle

Conclusion :

La combinaison d'un premier formant très bas (\(F_1=300\) Hz) et d'un deuxième formant très haut (\(F_2=2300\) Hz) est la signature acoustique caractéristique de la voyelle [i] (comme dans le mot "si" ou "vie").

Résultat Question 3 : La voyelle prononcée est très probablement la voyelle [i].

Question 4 : Position de la Langue pour la Voyelle [i]

Analyse :

Les fréquences des formants sont directement liées à la géométrie du conduit vocal :

  • Le premier formant (F1) est inversement corrélé à la hauteur de la langue. Un F1 bas (comme 300 Hz) signifie que le corps de la langue est très haut dans la bouche.
  • Le deuxième formant (F2) est corrélé à la position avant/arrière de la langue. Un F2 haut (comme 2300 Hz) signifie que le corps de la langue est très avancé dans la bouche, vers les dents.

Par conséquent, pour produire la voyelle [i], le locuteur place sa langue très haut et très en avant dans sa bouche, ne laissant qu'un petit canal pour le passage de l'air.

Conclusion : La voyelle [i] est produite avec la langue en position haute et antérieure dans le conduit vocal.

Quiz Rapide : Testez vos connaissances

1. Un son avec un F1 élevé et un F2 bas correspondrait probablement à quelle voyelle ?

2. Le timbre d'un instrument de musique est principalement déterminé par...


Glossaire

Formant
Fréquence de résonance du conduit vocal. Les pics d'énergie dans le spectre d'une voyelle correspondent aux formants. Les deux premiers formants (F1 et F2) sont les plus importants pour distinguer les voyelles entre elles.
Spectre de Parole
Représentation de l'amplitude (ou de l'énergie) des différentes fréquences qui composent un son de parole à un instant donné.
Modèle Source-Filtre
Modèle de la production de la parole qui sépare le processus en deux parties : une source (les cordes vocales créant un son de base) et un filtre (le conduit vocal qui modifie ce son).
Espace F1-F2
Graphique où chaque voyelle est représentée par un point dont les coordonnées sont les fréquences de ses deux premiers formants (F1 sur l'axe des ordonnées, F2 sur l'axe des abscisses). Il permet de visualiser le "triangle vocalique".
Analyse des Formants - Exercice d'Application en Bioacoustique

D’autres exercices de Bioacoustique:

0 commentaires
Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *