Application d’une Transformée de Fourier Rapide

Application d'une Transformée de Fourier Rapide (FFT) à un Signal Audio

Application d'une Transformée de Fourier Rapide (FFT) à un Signal Audio

Comprendre : Le prisme de l'analyse de signal

La Transformée de Fourier Rapide (FFT) est un algorithme puissant qui permet de décomposer un signal du domaine temporel (amplitude en fonction du temps) en ses composantes fréquentielles (amplitude en fonction de la fréquence). C'est l'équivalent numérique d'un prisme qui décompose la lumière blanche en un arc-en-ciel de couleurs. Pour un signal audio, la FFT nous montre quelles "notes" (fréquences) sont présentes et à quel "volume" (amplitude). Le résultat d'une FFT est appelé un spectreReprésentation d'un signal dans le domaine fréquentiel, montrant l'amplitude (ou la puissance) de ses différentes composantes de fréquence..

Remarque Pédagogique : La sortie d'une FFT n'est pas une courbe continue, mais une série de valeurs discrètes appelées "bins" (ou "conteneurs"). Chaque bin représente une bande de fréquences. La précision de notre analyse dépend donc du nombre de bins et de la fréquence d'échantillonnage.

Données de l'étude

On analyse un court segment (ou "trame") d'un signal audio numérique. Ce signal est composé de la superposition de deux sinusoïdes pures.

Paramètres du signal et de l'analyse :

  • Fréquence de la première sinusoïde (\(f_1\)): \(440 \, \text{Hz}\) (note La 4)
  • Fréquence de la deuxième sinusoïde (\(f_2\)): \(880 \, \text{Hz}\) (son octave supérieure, La 5)
  • Fréquence d'échantillonnage (\(f_{\text{ech}}\)): \(44100 \, \text{Hz}\)
  • Taille de la FFT (\(N\)): 1024 points (ou échantillons)
Principe de la Transformée de Fourier Rapide (FFT)
Domaine Temporel FFT Domaine Fréquentiel Fréquence

Questions à traiter

  1. Calculer la résolution en fréquence (\(\Delta f\)) de cette FFT.
  2. Déterminer les indices (\(k\)) des "bins" où l'on s'attend à trouver les pics d'énergie pour \(f_1\) et \(f_2\).
  3. Si une analyse FFT d'un autre signal, avec les mêmes paramètres, montre un pic majeur au bin d'indice \(k=25\), quelle est la fréquence correspondante ?

Correction : Application d'une Transformée de Fourier Rapide (FFT)

Question 1 : Résolution en Fréquence (\(\Delta f\))

Principe :
Bande de Nyquist (fech/2) fech ÷ N Résolution (Δf) ...

Le résultat d'une FFT de taille \(N\) est un tableau de \(N\) valeurs complexes. Pour un signal réel, on s'intéresse généralement à la première moitié de ce tableau (\(N/2\) points), qui représente les fréquences de 0 Hz jusqu'à la fréquence de Nyquist. La résolution en fréquence, \(\Delta f\), est "l'espacement" entre chaque point (ou bin) de ce tableau. Elle nous dit quelle est la plus petite différence de fréquence que l'on peut distinguer.

Remarque Pédagogique :

Point Clé : La résolution en fréquence est un compromis. Pour une fréquence d'échantillonnage fixe, augmenter la taille de la FFT (\(N\)) améliore la résolution en fréquence (on peut distinguer des notes plus proches), mais cela nécessite d'analyser un segment de signal plus long, ce qui dégrade la "résolution temporelle" (notre capacité à savoir *quand* un son s'est produit).

Formule(s) utilisée(s) :
\[ \Delta f = \frac{f_{\text{ech}}}{N} \]
Données(s) :
  • \(f_{\text{ech}}\) : 44100 Hz
  • \(N\) : 1024
Calcul(s) :
\[ \begin{aligned} \Delta f &= \frac{44100 \, \text{Hz}}{1024} \\ &\approx 43.07 \, \text{Hz} \end{aligned} \]
Résultat Question 1 : Chaque bin de la FFT représente une bande de fréquence d'environ 43.07 Hz de large.

Question 2 : Indices des Bins (\(k\))

Principe :
Fréquence du signal (f) ÷ Δf = Indice k

Pour trouver dans quel bin une fréquence spécifique va "tomber", on divise simplement cette fréquence par la résolution en fréquence. Le résultat nous donne l'indice \(k\) du bin correspondant.

Remarque Pédagogique :

Point Clé : Le résultat n'est que rarement un entier parfait ! Si une fréquence tombe entre deux bins (ex: indice 10.2), son énergie sera répartie entre les bins les plus proches (principalement les bins 10 et 11). Ce phénomène est appelé le fuite spectraleLe phénomène par lequel l'énergie d'une seule fréquence sinusoïdale se répartit sur plusieurs bins de la FFT. Cela se produit lorsque la fréquence du signal n'est pas un multiple exact de la résolution en fréquence. (spectral leakage).

Formule(s) utilisée(s) :
\[ k = \frac{f_{\text{signal}}}{\Delta f} \]
Calcul(s) :

1. Indice pour \(f_1 = 440\) Hz

\[ \begin{aligned} k_1 &= \frac{440 \, \text{Hz}}{43.07 \, \text{Hz}} \\ &\approx 10.22 \end{aligned} \]

2. Indice pour \(f_2 = 880\) Hz

\[ \begin{aligned} k_2 &= \frac{880 \, \text{Hz}}{43.07 \, \text{Hz}} \\ &\approx 20.43 \end{aligned} \]
Résultat Question 2 : Le pic pour 440 Hz sera principalement visible entre les bins 10 et 11. Le pic pour 880 Hz sera principalement visible entre les bins 20 et 21.

Question 3 : Fréquence d'un Bin Donné

Principe :
Indice du bin (k) × Δf = Fréquence f

Cette opération est l'inverse de la précédente. Pour connaître la fréquence centrale représentée par un bin d'indice \(k\), on multiplie cet indice par la résolution en fréquence.

Remarque Pédagogique :

Point Clé : Cette opération inverse est fondamentale en analyse spectrale. C'est elle qui permet, par exemple, à un logiciel d'accordage de vous dire quelle note vous jouez, ou à un ingénieur du son d'identifier la fréquence exacte d'un bruit parasite (comme un "hum" à 50 Hz) pour pouvoir l'éliminer avec un filtre.

Formule(s) utilisée(s) :
\[ f_k = k \times \Delta f \]
Données(s) :
  • Indice du bin (\(k\)) : 25
  • Résolution en fréquence (\(\Delta f\)) : 43.07 Hz
Calcul(s) :
\[ \begin{aligned} f_{25} &= 25 \times 43.07 \, \text{Hz} \\ &= 1076.75 \, \text{Hz} \end{aligned} \]
Résultat Question 3 : Un pic au bin 25 correspond à une fréquence d'environ 1077 Hz.

Test de Compréhension : Avec les mêmes réglages, un pic au bin d'indice 5 représenterait une fréquence d'environ...


Tableau Récapitulatif Interactif

Cliquez sur les cases grisées pour révéler les résultats clés de l'exercice.

Paramètre Valeur Calculée
Résolution en Fréquence (\(\Delta f\)) Cliquez pour révéler
Indice pour 440 Hz (\(k_1\)) Cliquez pour révéler
Indice pour 880 Hz (\(k_2\)) Cliquez pour révéler
Fréquence pour k=25 Cliquez pour révéler

À vous de jouer ! (Défi)

Nouveau Scénario : On utilise une fréquence d'échantillonnage de 22050 Hz et une taille de FFT de 512 points. Quelle est la nouvelle résolution en fréquence (\(\Delta f\)) en Hz ?


Pièges à Éviter

Ignorer la fuite spectrale : Ne vous attendez pas à voir un seul bin non nul et tous les autres à zéro. L'énergie d'une sinusoïde sera toujours répartie sur plusieurs bins adjacents, surtout si sa fréquence n'est pas un multiple parfait de \(\Delta f\).

L'échelle de l'amplitude : L'amplitude des bins FFT dépend de nombreux facteurs (taille de la FFT, fonction de fenêtrage, ...). Pour des mesures absolues, une normalisation est nécessaire. Pour une simple détection de fréquences, on s'intéresse surtout aux positions des pics.


Simulation Interactive de Spectre FFT

Variez les fréquences du signal d'entrée pour voir où les pics apparaissent sur le spectre de la FFT.

Paramètres du Signal
Résolution (\(\Delta f\)):
Spectre de Magnitude (FFT)

Pour Aller Plus Loin : Scénarios de Réflexion

1. Fenêtrage (Windowing)

Pour réduire la fuite spectrale, on multiplie le segment de signal par une "fonction fenêtre" (ex: Hann, Hamming, Blackman) qui amène doucement le début et la fin du segment à zéro. Cela réduit les discontinuités et donne des pics de fréquence plus nets et mieux définis dans la FFT.

2. La Phase

Nous n'avons analysé que la magnitude (l'amplitude) des composantes fréquentielles. Mais la sortie de la FFT est complexe, elle contient aussi une information de phase pour chaque fréquence. La phase est cruciale pour la reconstruction du signal : elle indique comment les sinusoïdes sont alignées dans le temps les unes par rapport aux autres.

3. Spectrogramme

Un seul spectre FFT nous donne une "photographie" des fréquences d'un court instant. Pour analyser un son qui évolue dans le temps (comme la parole ou la musique), on calcule des FFT sur des trames successives et on les "empile" pour créer un spectrogramme : une image 2D montrant la fréquence, le temps et l'amplitude (par la couleur).


Le Saviez-Vous ?

La compression MP3 est basée sur un principe très similaire à la FFT. L'algorithme décompose le son en ses différentes bandes de fréquence, puis utilise un modèle psychoacoustique pour déterminer quelles fréquences sont moins audibles (car masquées par d'autres plus fortes) et les quantifie avec moins de précision, voire les supprime, afin de réduire drastiquement la taille du fichier.


Foire Aux Questions (FAQ)

Pourquoi la taille de la FFT est-elle toujours une puissance de 2 (1024, 2048, etc.) ?

La "Transformée de Fourier Rapide" (FFT) est un algorithme optimisé pour calculer la Transformée de Fourier Discrète (TFD). Ces optimisations fonctionnent de manière particulièrement efficace lorsque le nombre de points N est une puissance de 2, réduisant de manière spectaculaire le nombre d'opérations nécessaires par rapport à un N quelconque.

Pourquoi la FFT ne donne que N/2 points de fréquence utiles ?

Le résultat complet d'une FFT sur un signal réel est symétrique. La deuxième moitié du tableau (des bins N/2 à N-1) est une image miroir de la première moitié et ne contient pas d'information nouvelle. On se concentre donc sur les N/2+1 premiers points, qui couvrent les fréquences de 0 Hz à la fréquence de Nyquist.


Quiz Final : Testez vos connaissances

1. Pour une même fréquence d'échantillonnage, si on augmente la taille de la FFT (N), la résolution en fréquence (\(\Delta f\))...

2. Le phénomène où l'énergie d'une seule fréquence se répartit sur plusieurs bins FFT s'appelle :


Glossaire

FFT (Transformée de Fourier Rapide)
Un algorithme efficace pour calculer la Transformée de Fourier Discrète, qui convertit un signal du domaine temporel au domaine fréquentiel.
Domaine Fréquentiel
Une représentation d'un signal en fonction de la fréquence de ses composantes, plutôt qu'en fonction du temps.
Résolution en Fréquence (\(\Delta f\))
L'espacement en Hertz entre deux points (bins) adjacents dans le résultat d'une FFT. Elle représente la plus petite différence de fréquence que l'analyse peut distinguer.
Bin
Chacun des "conteneurs" de fréquence discrets qui composent le spectre de sortie d'une FFT. Chaque bin est centré sur un multiple de la résolution en fréquence.
FFT - Exercice d'Application

D’autres exercices d’électroacoustique:

0 commentaires
Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *