Analyse des Formants dans un Spectre de Parole

Analyse des Formants en Bioacoustique

Analyse des Formants dans un Spectre de Parole

Contexte : L'Analyse des FormantsLes formants sont les fréquences de résonance du tractus vocal qui caractérisent les voyelles. en Bioacoustique.

La bioacoustique est l'étude des sons produits par les êtres vivants. L'analyse de la parole humaine en est une branche fascinante. Les voyelles que nous prononçons sont caractérisées par des pics d'énergie à certaines fréquences, appelés formants. L'analyse de ces formants, notamment les deux premiers (F1 et F2), permet d'identifier une voyelle de manière fiable. Cette technique est au cœur de la reconnaissance vocale, de la linguistique et même du diagnostic de certaines pathologies.

Remarque Pédagogique : Cet exercice vous apprendra à lire un spectre de parole, à identifier les deux premiers formants (F1, F2) et à les utiliser pour reconnaître une voyelle spécifique à l'aide d'un diagramme acoustique.


Objectifs Pédagogiques

  • Identifier les pics spectraux correspondant aux formants F1 et F2.
  • Lire les fréquences des formants à partir d'un spectre de puissance.
  • Placer un point (F1, F2) sur un diagramme des voyelles pour identifier le son.
  • Comprendre la relation entre la position des articulateurs (langue) et les fréquences des formants.

Données de l'étude

Nous analysons un enregistrement audio d'un locuteur prononçant une voyelle de manière soutenue. Le signal a été traité par une Transformée de Fourier Rapide (FFT) pour obtenir son spectre de puissance. L'objectif est d'identifier la voyelle à partir de ce spectre.

Fiche Technique de l'Analyse
Caractéristique Valeur
Fréquence d'échantillonnage 22050 Hz
Fenêtre d'analyse Hamming, 512 points
Locuteur Homme adulte
Spectre de Puissance de la Voyelle
Fréquence (Hz) Amplitude (dB) 0 1k 2k 3k 4k F1 F2

Questions à traiter

  1. À partir du spectre de puissance fourni, identifiez le premier pic majeur (le plus bas en fréquence) et estimez la fréquence du premier formant (F1).
  2. Identifiez le deuxième pic d'amplitude significative et estimez la fréquence du deuxième formant (F2).
  3. En utilisant les valeurs (F1, F2) et un diagramme acoustique des voyelles (fourni dans la correction), quelle est la voyelle la plus probable ?
  4. Sachant que F1 est inversement corrélé à la hauteur de la langue et F2 est corrélé à sa position avant/arrière, décrivez la configuration probable du tractus vocal pour produire cette voyelle.

Les bases de l'acoustique de la parole

Pour comprendre cet exercice, deux concepts clés de la production de la parole sont nécessaires.

1. Le Modèle Source-Filtre
La production de sons voisés (comme les voyelles) est souvent décrite par ce modèle.

  • La Source : C'est la vibration des cordes vocales dans le larynx, qui produit une onde sonore riche en harmoniques, dont la plus basse est la fréquence fondamentale (F0)La fréquence la plus basse de vibration des cordes vocales, perçue comme la hauteur de la voix..
  • Le Filtre : C'est le tractus vocalL'ensemble des cavités (pharynx, bouche, cavités nasales) qui filtrent le son produit par les cordes vocales. (gorge, bouche, nez) qui agit comme une caisse de résonance. Il amplifie certaines fréquences (les résonances) et en atténue d'autres. Ces pics de résonance sont les formants.

2. Caractérisation des Voyelles par les Formants
En changeant la forme de notre tractus vocal (principalement avec la langue et les lèvres), nous changeons les fréquences des formants, ce qui nous permet de produire différentes voyelles.

  • F1 (hauteur de la voyelle) : La fréquence du premier formant est inversement proportionnelle à la hauteur de la langue. Une langue haute (voyelle fermée comme /i/ ou /u/) donne un F1 bas. Une langue basse (voyelle ouverte comme /a/) donne un F1 élevé.
  • F2 (position avant/arrière) : La fréquence du deuxième formant est liée à la position avant ou arrière de la langue. Une langue en avant (voyelle antérieure comme /i/) donne un F2 élevé. Une langue en arrière (voyelle postérieure comme /u/) donne un F2 bas.

3. Exemple de Calcul : Ratio Formantique
Le ratio entre les formants peut parfois être utilisé comme un indice acoustique complémentaire. Calculons par exemple le ratio F2/F1 pour la voyelle étudiée.

Formule du Ratio Formantique

\[ \text{Ratio} = \frac{F_2}{F_1} \]

Application Numérique

\[ \begin{aligned} \text{Ratio} &= \frac{2300 \text{ Hz}}{280 \text{ Hz}} \\ &\approx 8.21 \end{aligned} \]

Un ratio F2/F1 élevé est une caractéristique forte de la voyelle /i/.


Correction : Analyse des Formants dans un Spectre de Parole

Question 1 : Mesure du premier formant (F1)

Principe

Le premier formant (F1) correspond au premier pic d'énergie majeur sur le spectre, à la fréquence la plus basse (en ignorant le pic de la fréquence fondamentale F0, qui est généralement encore plus bas et non représenté ici pour la clarté).

Mini-Cours

Fréquence Fondamentale (F0) vs. Formants : La F0 est la source (vibration des cordes vocales), perçue comme la hauteur de la voix. Les formants sont des résonances du filtre (le tractus vocal), perçus comme le timbre de la voyelle. Il ne faut pas confondre le premier harmonique (F0) avec le premier formant (F1), qui est une concentration d'harmoniques amplifiées.

Donnée(s)

Nous utilisons le spectre de puissance fourni dans l'énoncé de l'exercice.

Schéma (Avant les calculs)

Le spectre de puissance complet est la donnée d'entrée pour notre analyse.

Spectre de Puissance de la Voyelle
Fréquence (Hz)Amplitude (dB)01k2k3k4kF1F2
Schéma (Après les calculs)

Le schéma suivant met en évidence le premier pic formantiel (F1) que nous avons identifié sur le spectre.

Identification du Premier Formant (F1)
Fréquence (Hz)Amplitude (dB)01k2kF1 ≈ 280 Hz
Réflexions

Cette fréquence est relativement basse, ce qui, d'après nos connaissances théoriques, suggère une voyelle produite avec la langue en position haute dans la bouche (voyelle dite "fermée").

Points de vigilances

Attention : Sur un spectre réel, il peut y avoir de nombreux petits pics qui sont des harmoniques. Il est crucial d'identifier le pic qui forme une "enveloppe" ou une "montagne" d'énergie, plutôt qu'un pic isolé.

Résultat Final
Le premier formant (F1) est mesuré à environ 280 Hz.

Question 2 : Mesure du deuxième formant (F2)

Principe

Le deuxième formant (F2) est le deuxième pic d'énergie majeur, situé à une fréquence plus élevée que F1, et qui joue un rôle crucial dans la distinction des voyelles antérieures et postérieures.

Mini-Cours

Largeur de bande (Bandwidth) : Les formants ne sont pas des fréquences uniques mais des pics avec une certaine largeur. Cette "largeur de bande" est liée à l'amortissement des résonances dans le tractus vocal. Visuellement, un formant avec une grande largeur de bande apparaîtra plus "aplati" sur le spectre.

Donnée(s)

Nous utilisons à nouveau le spectre de puissance fourni dans l'énoncé de l'exercice.

Schéma (Avant les calculs)

Le spectre complet nous sert de base pour localiser le second pic d'énergie pertinent.

Spectre de Puissance de la Voyelle
Fréquence (Hz)Amplitude (dB)01k2k3k4kF1F2
Schéma (Après les calculs)

Le second pic (F2) est maintenant mis en évidence sur le spectre pour visualiser sa position.

Identification du Second Formant (F2)
Fréquence (Hz)Amplitude (dB)1k2k3kF2 ≈ 2300 Hz
Réflexions

Cette fréquence F2 est très élevée. Théoriquement, cela indique une voyelle produite avec la langue positionnée très en avant dans la cavité buccale (voyelle dite "antérieure").

Points de vigilances

Attention : L'amplitude de F2 est souvent plus faible que celle de F1. Il ne faut pas se fier uniquement à la hauteur du pic, mais bien chercher le deuxième "massif" d'énergie le long de l'axe des fréquences.

Résultat Final
Le deuxième formant (F2) est mesuré à environ 2300 Hz.

Question 3 : Identification de la voyelle

Principe

Le couple de valeurs (F1, F2) forme une signature acoustique pour chaque voyelle. En plaçant ce point sur un diagramme de référence, appelé "espace acoustique des voyelles", on peut identifier la voyelle perçue par l'oreille humaine.

Mini-Cours

Espace Acoustique et Variabilité : Les zones des voyelles sur le diagramme ne sont pas des points fixes mais des ellipses. Elles représentent la variabilité naturelle de la parole entre différents locuteurs (homme, femme, enfant) et même pour un même locuteur. L'important est de se situer au cœur de l'une de ces zones.

Donnée(s)

Nous utilisons les valeurs de F1 et F2 déterminées dans les questions précédentes.

ParamètreValeur Estimée
Formant 1 (F1)280 Hz
Formant 2 (F2)2300 Hz
Schéma (Avant les calculs)

Le diagramme acoustique des voyelles est notre espace de référence. Avant de placer notre point, il représente les zones typiques pour chaque voyelle.

Diagramme Acoustique de Référence
F1 (Hz)F2 (Hz)20040060080050015002500ieɛɔoua
Schéma (Après les calculs)

Nous reportons le point de coordonnées (F1=280, F2=2300) sur le diagramme. Ce diagramme est une représentation visuelle du résultat de nos mesures.

Positionnement de la Voyelle Mesurée
F1 (Hz)F2 (Hz)20040060080050015002500ieɛɔoua(F1≈280, F2≈2300)
Calcul Complémentaire : Ratio Formantique

Pour confirmer notre identification, nous pouvons calculer le ratio F2/F1. Un ratio très élevé est une caractéristique forte de la voyelle /i/.

Calcul du ratio F2/F1

\[ \begin{aligned} \text{Ratio} &= \frac{F_2}{F_1} \\ &= \frac{2300 \text{ Hz}}{280 \text{ Hz}} \\ &\approx 8.21 \end{aligned} \]

Ce ratio élevé confirme que la voyelle est très probablement /i/.

Réflexions

Le point correspondant à nos mesures (F1≈280 Hz, F2≈2300 Hz) se situe sans ambiguïté dans la zone de la voyelle /i/ (le son "i" comme dans "si"). Le calcul du ratio F2/F1, qui est très élevé, renforce cette conclusion.

Points de vigilances

Attention : Le diagramme présenté est typique pour un locuteur masculin adulte. Les valeurs des formants, et donc la position des ellipses, varient pour les femmes et les enfants, dont le tractus vocal est plus court. Il faut toujours utiliser un diagramme de référence adapté.

Résultat Final
La voyelle prononcée est la voyelle /i/.

Question 4 : Configuration du tractus vocal

Principe

Il s'agit de faire le lien entre les mesures acoustiques (F1, F2) et le mouvement physique des articulateurs (la langue) en se basant sur les règles vues dans la section théorique.

Mini-Cours

Théorie Perturbatrice : Cette théorie explique comment une constriction (un resserrement) dans le tractus vocal affecte les formants. Pour simplifier : une constriction à l'avant (derrière les dents) fait monter F2 (cas du /i/), tandis qu'une constriction à l'arrière (dans le pharynx) fait baisser F2 (cas du /u/).

Donnée(s)

L'information clé est l'identité de la voyelle, déterminée à la question 3.

ParamètreValeur
Voyelle Identifiée/i/
Schéma (Avant les calculs)

Avant de déterminer la position des articulateurs pour /i/, voici une vue schématique du tractus vocal dans une position neutre (schwa /ə/).

Tractus Vocal - Position Neutre
Langue (neutre)PalaisLèvresPharynx
Schéma (Après les calculs)

En nous basant sur les corrélats articulatoires (F1 bas = langue haute, F2 haut = langue avant), nous pouvons dessiner la configuration du tractus vocal pour la voyelle /i/.

Configuration Articulatoire pour la Voyelle /i/
LangueHAUTEAVANT
Réflexions

  • Un F1 bas (280 Hz) est la signature d'une langue très haute dans la bouche, réduisant le volume de la cavité pharyngale.
  • Un F2 haut (2300 Hz) est la signature d'une langue très en avant, raccourcissant la cavité buccale avant le point de constriction.
Cette double caractéristique (haute et avant) est la définition articulatoire de la voyelle /i/. On peut presque "sentir" cette position en prononçant le son "iiii".

Points de vigilances

Attention : Le modèle articulatoire à deux dimensions (hauteur/position avant-arrière) est une simplification. En réalité, la production de la parole implique un mouvement 3D complexe de la langue, ainsi que des ajustements des lèvres (arrondissement pour /u/) et du voile du palais.

Résultat Final
La configuration du tractus vocal est : langue haute et avancée dans la cavité buccale.

Outil Interactif : Synthétiseur de Voyelles

Utilisez les curseurs pour simuler le mouvement de la langue et observez comment les fréquences des formants F1 et F2 changent. Le graphique montre la position de la voyelle synthétisée dans l'espace acoustique.

Paramètres Articulatoires
85
95
Résultats Acoustiques
Formant 1 (F1) - Hz
Formant 2 (F2) - Hz
Voyelle la plus proche ?

Quiz Final : Testez vos connaissances

1. Quelle est la "source" du son dans le modèle source-filtre de la parole ?

2. Un F1 bas est généralement associé à :

3. Un F2 élevé est généralement associé à :

4. Quelle voyelle est caractérisée par un F1 élevé et un F2 moyen ?

5. L'analyse des formants est principalement utilisée pour caractériser :


Glossaire

Formant
Une fréquence de résonance du tractus vocal qui est amplifiée et qui apparaît comme un pic dans le spectre sonore. Les formants caractérisent l'identité d'une voyelle.
Fréquence Fondamentale (F0)
La fréquence la plus basse de vibration des cordes vocales, perçue par l'oreille humaine comme la hauteur (ou la tonalité) de la voix.
Spectre
Représentation de l'amplitude (ou de l'énergie) d'un signal sonore en fonction de la fréquence, à un instant donné.
Tractus Vocal
L'ensemble des cavités et organes au-dessus du larynx (pharynx, bouche, cavités nasales) qui agissent comme un filtre pour modifier le son brut produit par les cordes vocales.
Analyse des Formants en Bioacoustique

D’autres exercices de Bioacoustique:

Étude de la Plasticité Auditive
Étude de la Plasticité Auditive

Plasticité du Système Auditif en Bioacoustique Étude de la Plasticité Auditive en Bioacoustique Contexte : L'adaptation des systèmes sensoriels à l'environnement. La plasticité neuronaleCapacité du système nerveux à modifier sa structure et sa fonction en réponse à...

0 commentaires
Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *