Analyse des Formants dans un Spectre de Parole
Contexte : L'Analyse des FormantsLes formants sont les fréquences de résonance du tractus vocal qui caractérisent les voyelles. en Bioacoustique.
La bioacoustique est l'étude des sons produits par les êtres vivants. L'analyse de la parole humaine en est une branche fascinante. Les voyelles que nous prononçons sont caractérisées par des pics d'énergie à certaines fréquences, appelés formants. L'analyse de ces formants, notamment les deux premiers (F1 et F2), permet d'identifier une voyelle de manière fiable. Cette technique est au cœur de la reconnaissance vocale, de la linguistique et même du diagnostic de certaines pathologies.
Remarque Pédagogique : Cet exercice vous apprendra à lire un spectre de parole, à identifier les deux premiers formants (F1, F2) et à les utiliser pour reconnaître une voyelle spécifique à l'aide d'un diagramme acoustique.
Objectifs Pédagogiques
- Identifier les pics spectraux correspondant aux formants F1 et F2.
- Lire les fréquences des formants à partir d'un spectre de puissance.
- Placer un point (F1, F2) sur un diagramme des voyelles pour identifier le son.
- Comprendre la relation entre la position des articulateurs (langue) et les fréquences des formants.
Données de l'étude
Fiche Technique de l'Analyse
| Caractéristique | Valeur |
|---|---|
| Fréquence d'échantillonnage | 22050 Hz |
| Fenêtre d'analyse | Hamming, 512 points |
| Locuteur | Homme adulte |
Spectre de Puissance de la Voyelle
Questions à traiter
- À partir du spectre de puissance fourni, identifiez le premier pic majeur (le plus bas en fréquence) et estimez la fréquence du premier formant (F1).
- Identifiez le deuxième pic d'amplitude significative et estimez la fréquence du deuxième formant (F2).
- En utilisant les valeurs (F1, F2) et un diagramme acoustique des voyelles (fourni dans la correction), quelle est la voyelle la plus probable ?
- Sachant que F1 est inversement corrélé à la hauteur de la langue et F2 est corrélé à sa position avant/arrière, décrivez la configuration probable du tractus vocal pour produire cette voyelle.
Les bases de l'acoustique de la parole
Pour comprendre cet exercice, deux concepts clés de la production de la parole sont nécessaires.
1. Le Modèle Source-Filtre
La production de sons voisés (comme les voyelles) est souvent décrite par ce modèle.
- La Source : C'est la vibration des cordes vocales dans le larynx, qui produit une onde sonore riche en harmoniques, dont la plus basse est la fréquence fondamentale (F0)La fréquence la plus basse de vibration des cordes vocales, perçue comme la hauteur de la voix..
- Le Filtre : C'est le tractus vocalL'ensemble des cavités (pharynx, bouche, cavités nasales) qui filtrent le son produit par les cordes vocales. (gorge, bouche, nez) qui agit comme une caisse de résonance. Il amplifie certaines fréquences (les résonances) et en atténue d'autres. Ces pics de résonance sont les formants.
2. Caractérisation des Voyelles par les Formants
En changeant la forme de notre tractus vocal (principalement avec la langue et les lèvres), nous changeons les fréquences des formants, ce qui nous permet de produire différentes voyelles.
- F1 (hauteur de la voyelle) : La fréquence du premier formant est inversement proportionnelle à la hauteur de la langue. Une langue haute (voyelle fermée comme /i/ ou /u/) donne un F1 bas. Une langue basse (voyelle ouverte comme /a/) donne un F1 élevé.
- F2 (position avant/arrière) : La fréquence du deuxième formant est liée à la position avant ou arrière de la langue. Une langue en avant (voyelle antérieure comme /i/) donne un F2 élevé. Une langue en arrière (voyelle postérieure comme /u/) donne un F2 bas.
3. Exemple de Calcul : Ratio Formantique
Le ratio entre les formants peut parfois être utilisé comme un indice acoustique complémentaire. Calculons par exemple le ratio F2/F1 pour la voyelle étudiée.
Formule du Ratio Formantique
Application Numérique
Un ratio F2/F1 élevé est une caractéristique forte de la voyelle /i/.
Correction : Analyse des Formants dans un Spectre de Parole
Question 1 : Mesure du premier formant (F1)
Principe
Le premier formant (F1) correspond au premier pic d'énergie majeur sur le spectre, à la fréquence la plus basse (en ignorant le pic de la fréquence fondamentale F0, qui est généralement encore plus bas et non représenté ici pour la clarté).
Mini-Cours
Fréquence Fondamentale (F0) vs. Formants : La F0 est la source (vibration des cordes vocales), perçue comme la hauteur de la voix. Les formants sont des résonances du filtre (le tractus vocal), perçus comme le timbre de la voyelle. Il ne faut pas confondre le premier harmonique (F0) avec le premier formant (F1), qui est une concentration d'harmoniques amplifiées.
Donnée(s)
Nous utilisons le spectre de puissance fourni dans l'énoncé de l'exercice.
Schéma (Avant les calculs)
Le spectre de puissance complet est la donnée d'entrée pour notre analyse.
Spectre de Puissance de la Voyelle
Schéma (Après les calculs)
Le schéma suivant met en évidence le premier pic formantiel (F1) que nous avons identifié sur le spectre.
Identification du Premier Formant (F1)
Réflexions
Cette fréquence est relativement basse, ce qui, d'après nos connaissances théoriques, suggère une voyelle produite avec la langue en position haute dans la bouche (voyelle dite "fermée").
Points de vigilances
Attention : Sur un spectre réel, il peut y avoir de nombreux petits pics qui sont des harmoniques. Il est crucial d'identifier le pic qui forme une "enveloppe" ou une "montagne" d'énergie, plutôt qu'un pic isolé.
Résultat Final
Question 2 : Mesure du deuxième formant (F2)
Principe
Le deuxième formant (F2) est le deuxième pic d'énergie majeur, situé à une fréquence plus élevée que F1, et qui joue un rôle crucial dans la distinction des voyelles antérieures et postérieures.
Mini-Cours
Largeur de bande (Bandwidth) : Les formants ne sont pas des fréquences uniques mais des pics avec une certaine largeur. Cette "largeur de bande" est liée à l'amortissement des résonances dans le tractus vocal. Visuellement, un formant avec une grande largeur de bande apparaîtra plus "aplati" sur le spectre.
Donnée(s)
Nous utilisons à nouveau le spectre de puissance fourni dans l'énoncé de l'exercice.
Schéma (Avant les calculs)
Le spectre complet nous sert de base pour localiser le second pic d'énergie pertinent.
Spectre de Puissance de la Voyelle
Schéma (Après les calculs)
Le second pic (F2) est maintenant mis en évidence sur le spectre pour visualiser sa position.
Identification du Second Formant (F2)
Réflexions
Cette fréquence F2 est très élevée. Théoriquement, cela indique une voyelle produite avec la langue positionnée très en avant dans la cavité buccale (voyelle dite "antérieure").
Points de vigilances
Attention : L'amplitude de F2 est souvent plus faible que celle de F1. Il ne faut pas se fier uniquement à la hauteur du pic, mais bien chercher le deuxième "massif" d'énergie le long de l'axe des fréquences.
Résultat Final
Question 3 : Identification de la voyelle
Principe
Le couple de valeurs (F1, F2) forme une signature acoustique pour chaque voyelle. En plaçant ce point sur un diagramme de référence, appelé "espace acoustique des voyelles", on peut identifier la voyelle perçue par l'oreille humaine.
Mini-Cours
Espace Acoustique et Variabilité : Les zones des voyelles sur le diagramme ne sont pas des points fixes mais des ellipses. Elles représentent la variabilité naturelle de la parole entre différents locuteurs (homme, femme, enfant) et même pour un même locuteur. L'important est de se situer au cœur de l'une de ces zones.
Donnée(s)
Nous utilisons les valeurs de F1 et F2 déterminées dans les questions précédentes.
| Paramètre | Valeur Estimée |
|---|---|
| Formant 1 (F1) | 280 Hz |
| Formant 2 (F2) | 2300 Hz |
Schéma (Avant les calculs)
Le diagramme acoustique des voyelles est notre espace de référence. Avant de placer notre point, il représente les zones typiques pour chaque voyelle.
Diagramme Acoustique de Référence
Schéma (Après les calculs)
Nous reportons le point de coordonnées (F1=280, F2=2300) sur le diagramme. Ce diagramme est une représentation visuelle du résultat de nos mesures.
Positionnement de la Voyelle Mesurée
Calcul Complémentaire : Ratio Formantique
Pour confirmer notre identification, nous pouvons calculer le ratio F2/F1. Un ratio très élevé est une caractéristique forte de la voyelle /i/.
Calcul du ratio F2/F1
Ce ratio élevé confirme que la voyelle est très probablement /i/.
Réflexions
Le point correspondant à nos mesures (F1≈280 Hz, F2≈2300 Hz) se situe sans ambiguïté dans la zone de la voyelle /i/ (le son "i" comme dans "si"). Le calcul du ratio F2/F1, qui est très élevé, renforce cette conclusion.
Points de vigilances
Attention : Le diagramme présenté est typique pour un locuteur masculin adulte. Les valeurs des formants, et donc la position des ellipses, varient pour les femmes et les enfants, dont le tractus vocal est plus court. Il faut toujours utiliser un diagramme de référence adapté.
Résultat Final
Question 4 : Configuration du tractus vocal
Principe
Il s'agit de faire le lien entre les mesures acoustiques (F1, F2) et le mouvement physique des articulateurs (la langue) en se basant sur les règles vues dans la section théorique.
Mini-Cours
Théorie Perturbatrice : Cette théorie explique comment une constriction (un resserrement) dans le tractus vocal affecte les formants. Pour simplifier : une constriction à l'avant (derrière les dents) fait monter F2 (cas du /i/), tandis qu'une constriction à l'arrière (dans le pharynx) fait baisser F2 (cas du /u/).
Donnée(s)
L'information clé est l'identité de la voyelle, déterminée à la question 3.
| Paramètre | Valeur |
|---|---|
| Voyelle Identifiée | /i/ |
Schéma (Avant les calculs)
Avant de déterminer la position des articulateurs pour /i/, voici une vue schématique du tractus vocal dans une position neutre (schwa /ə/).
Tractus Vocal - Position Neutre
Schéma (Après les calculs)
En nous basant sur les corrélats articulatoires (F1 bas = langue haute, F2 haut = langue avant), nous pouvons dessiner la configuration du tractus vocal pour la voyelle /i/.
Configuration Articulatoire pour la Voyelle /i/
Réflexions
- Un F1 bas (280 Hz) est la signature d'une langue très haute dans la bouche, réduisant le volume de la cavité pharyngale.
- Un F2 haut (2300 Hz) est la signature d'une langue très en avant, raccourcissant la cavité buccale avant le point de constriction.
Points de vigilances
Attention : Le modèle articulatoire à deux dimensions (hauteur/position avant-arrière) est une simplification. En réalité, la production de la parole implique un mouvement 3D complexe de la langue, ainsi que des ajustements des lèvres (arrondissement pour /u/) et du voile du palais.
Résultat Final
Outil Interactif : Synthétiseur de Voyelles
Utilisez les curseurs pour simuler le mouvement de la langue et observez comment les fréquences des formants F1 et F2 changent. Le graphique montre la position de la voyelle synthétisée dans l'espace acoustique.
Paramètres Articulatoires
Résultats Acoustiques
Quiz Final : Testez vos connaissances
1. Quelle est la "source" du son dans le modèle source-filtre de la parole ?
2. Un F1 bas est généralement associé à :
3. Un F2 élevé est généralement associé à :
4. Quelle voyelle est caractérisée par un F1 élevé et un F2 moyen ?
5. L'analyse des formants est principalement utilisée pour caractériser :
Glossaire
- Formant
- Une fréquence de résonance du tractus vocal qui est amplifiée et qui apparaît comme un pic dans le spectre sonore. Les formants caractérisent l'identité d'une voyelle.
- Fréquence Fondamentale (F0)
- La fréquence la plus basse de vibration des cordes vocales, perçue par l'oreille humaine comme la hauteur (ou la tonalité) de la voix.
- Spectre
- Représentation de l'amplitude (ou de l'énergie) d'un signal sonore en fonction de la fréquence, à un instant donné.
- Tractus Vocal
- L'ensemble des cavités et organes au-dessus du larynx (pharynx, bouche, cavités nasales) qui agissent comme un filtre pour modifier le son brut produit par les cordes vocales.
D’autres exercices de Bioacoustique:




















0 commentaires