Application du Théorème de Shannon

Exercice : Théorème de Shannon en Électroacoustique

Application du Théorème de Shannon

Contexte : La Numérisation d'un Signal AudioProcessus de conversion d'un son (signal analogique) en une suite de nombres (signal numérique) qu'un ordinateur peut traiter..

Le passage du monde analogique (vinyles, cassettes) au monde numérique (CD, MP3, streaming) a été rendu possible par le processus de numérisation. Une étape cruciale de ce processus est l'échantillonnage, qui consiste à "prélever" des valeurs du signal analogique à intervalles de temps réguliers. Le théorème de Shannon nous donne la condition fondamentale pour réaliser cette opération sans perdre d'information. Cet exercice a pour but de déterminer la fréquence d'échantillonnageNombre d'échantillons (mesures) d'un signal prélevés par seconde. Elle est mesurée en Hertz (Hz). adéquate pour un signal audio destiné à la qualité CD.

Remarque Pédagogique : Cet exercice vous permettra de comprendre le lien direct entre la richesse fréquentielle d'un son (sa bande passante) et les paramètres techniques requis pour sa numérisation fidèle. C'est le fondement de toute l'audio numérique moderne.


Objectifs Pédagogiques

  • Comprendre et appliquer le critère de Nyquist-Shannon.
  • Identifier le phénomène de repliement de spectre (aliasing).
  • Calculer la fréquence d'échantillonnage minimale pour un signal audio donné.

Données de l'étude

On souhaite numériser un signal musical capté par un microphone. L'objectif est de conserver une haute fidélité, en couvrant l'ensemble du spectre audible par l'oreille humaine.

Fiche Technique du Projet
Caractéristique Valeur
Type de signal Signal audio analogique
Bande passante du signal 20 Hz - 20 000 Hz
Objectif de qualité Qualité CD (Compact Disc)
Principe de l'échantillonnage d'un signal
Temps (t) Amplitude Te Signal Analogique
Paramètre Description Symbole Valeur
Fréquence maximale du signal La plus haute fréquence contenue dans le signal audio. \(f_{\text{max}}\) 20 kHz
Fréquence d'échantillonnage (CD) Fréquence standard utilisée pour les Compact Discs. \(f_{\text{e, CD}}\) 44.1 kHz

Questions à traiter

  1. Rappeler l'énoncé du théorème de Nyquist-Shannon et la condition qui en découle sur la fréquence d'échantillonnage \(f_e\).
  2. Calculer la fréquence d'échantillonnage minimale (\(f_{\text{e, min}}\)) requise pour numériser correctement le signal audio donné.
  3. Comparer cette valeur minimale à la fréquence standard des CD (44.1 kHz) et justifier l'intérêt de la marge existante.
  4. Que se passerait-il si on échantillonnait ce signal avec une fréquence \(f_e = 30\) kHz ? Calculer la fréquence "alias" d'une note pure de 18 kHz.
  5. Expliquer le rôle d'un filtre "anti-repliement" (anti-aliasing) et préciser sa position dans la chaîne de numérisation.

Les bases sur l'Échantillonnage et Shannon

La conversion d'un signal analogique en numérique comporte deux étapes principales : l'échantillonnage (discrétisation temporelle) et la quantification (discrétisation d'amplitude). Cet exercice se concentre sur l'échantillonnage, régi par le théorème de Shannon.

1. Théorème de Nyquist-Shannon
Pour qu'un signal analogique puisse être parfaitement reconstruit à partir de ses échantillons, la fréquence d'échantillonnage \(f_e\) doit être au moins deux fois supérieure à la fréquence maximale \(f_{\text{max}}\) contenue dans ce signal.

\[ f_e \ge 2 \cdot f_{\text{max}} \]

2. Le Repliement de Spectre (Aliasing)
Si la condition de Shannon n'est pas respectée (\(f_e < 2 \cdot f_{\text{max}}\)), les fréquences du signal supérieures à \(f_e/2\) (la fréquence de Nyquist) ne sont pas correctement capturées. Elles "se replient" dans la bande de fréquence utile et apparaissent sous la forme de fréquences plus basses, inexistantes dans le signal original. C'est un artefact de distorsion irréversible.


Correction : Application du Théorème de Shannon

Question 1 : Énoncé du théorème de Nyquist-Shannon

Principe

Le théorème établit la condition mathématique minimale pour capturer toute l'information d'un signal continu en le mesurant à intervalles réguliers. L'idée est qu'il faut au moins deux points par cycle de la plus haute fréquence pour pouvoir "deviner" la forme de l'onde sans ambiguïté.

Mini-Cours

Le théorème de Nyquist-Shannon stipule qu'un signal dont le spectre est limité en fréquence (c'est-à-dire qu'il n'y a pas de composantes de fréquence au-delà de \(f_{\text{max}}\)) peut être reconstruit sans erreur à partir d'une série d'échantillons pris à une fréquence \(f_e\) si et seulement si cette fréquence est supérieure au double de la fréquence maximale.

Formule(s)

Condition de Shannon

\[ f_e > 2 \cdot f_{\text{max}} \]
Résultat Final
Pour une reconstruction parfaite, la fréquence d'échantillonnage \(f_e\) doit être strictement supérieure à deux fois la fréquence maximale du signal \(f_{\text{max}}\). La fréquence \(2 \cdot f_{\text{max}}\) est appelée la fréquence de Nyquist.

Question 2 : Calcul de la fréquence d'échantillonnage minimale

Principe

Le concept physique est de déterminer la "vitesse de capture" minimale pour ne manquer aucune information d'un signal qui évolue rapidement. En appliquant le critère de Shannon, on s'assure que notre "appareil photo" numérique est assez rapide pour capturer le mouvement le plus vif du signal.

Mini-Cours

La fréquence maximale (\(f_{\text{max}}\)) d'un signal est la composante la plus rapide qui le constitue. C'est elle qui dicte la contrainte d'échantillonnage. Ignorer cette composante, même si elle est faible en amplitude, conduit à une perte d'information. La fréquence de Nyquist (\(2 \cdot f_{\text{max}}\)) représente donc la frontière théorique absolue pour une capture parfaite du signal.

Remarque Pédagogique

Face à un problème d'échantillonnage, le premier réflexe doit toujours être d'identifier la fréquence maximale du signal d'intérêt. C'est le paramètre clé qui conditionne tout le reste de la chaîne de numérisation. Cherchez-la explicitement dans l'énoncé ou déduisez-la du contexte (ex: spectre audible, signal téléphonique, etc.).

Normes

Bien qu'il s'agisse ici d'un calcul théorique, les fréquences d'échantillonnage sont standardisées dans l'industrie audio. Par exemple, la norme AES/EBU (Audio Engineering Society/European Broadcasting Union) et la recommandation UIT-R 646 définissent des fréquences standards comme 32 kHz, 44.1 kHz, et 48 kHz pour les applications professionnelles.

Formule(s)

Fréquence d'échantillonnage minimale

\[ f_{\text{e, min}} = 2 \cdot f_{\text{max}} \]
Hypothèses

Pour ce calcul, nous posons deux hypothèses simplificatrices mais fondamentales :

  • Le signal est à bande limitée : il ne contient absolument aucune énergie au-delà de 20 kHz.
  • Nous visons une reconstruction théoriquement parfaite, sans tenir compte des contraintes technologiques (filtres imparfaits).

Donnée(s)

La seule donnée d'entrée nécessaire est la fréquence maximale du signal, tirée de l'énoncé.

ParamètreSymboleValeurUnité
Fréquence maximale du signal audio\(f_{\text{max}}\)20kHz
Astuces

Pour une vérification rapide, pensez simplement : "Je dois au moins doubler la plus haute fréquence". Si on vous parle d'un signal "Hi-Fi" ou "qualité CD", la fréquence maximale à considérer par défaut est de 20 kHz.

Schéma (Avant les calculs)

Visualisons le spectre du signal audio. Il est représenté par une zone s'étendant de 0 à la fréquence maximale, \(f_{\text{max}}\).

Spectre du Signal d'Entrée
Fréquence (kHz)Amplitudef_max = 200
Calcul(s)

L'application numérique consiste à remplacer la variable par sa valeur dans la formule.

Calcul de la fréquence minimale

\[ \begin{aligned} f_{\text{e, min}} &= 2 \cdot f_{\text{max}} \\ &= 2 \times 20\,\text{kHz} \\ &= 40\,\text{kHz} \end{aligned} \]
Schéma (Après les calculs)

Le résultat de 40 kHz définit une frontière. Toute fréquence d'échantillonnage choisie doit être dans la zone de sur-échantillonnage pour respecter la condition de Shannon.

Zone de Conformité de Shannon
Zone de sous-échantillonnage (Aliasing)Zone de sur-échantillonnage (Correct)fe,min = 40kHz
Réflexions

Ce résultat signifie que pour capturer fidèlement un son contenant des fréquences jusqu'à 20 kHz, il faut effectuer 40 000 "photographies" (mesures d'amplitude) de ce son chaque seconde. C'est un débit considérable qui justifie l'utilisation de processeurs de signal numérique (DSP) puissants.

Points de vigilance

La principale erreur est de confondre les unités : le signal est donné en kHz, le résultat doit donc être en kHz. Faites attention aux conversions si l'on vous donnait une valeur en Hz. Une autre erreur serait de diviser par deux au lieu de multiplier, ce qui est l'inverse de la logique de Shannon.

Points à retenir

Pour maîtriser cette question, retenez trois choses : 1) Le critère de Shannon lie la fréquence d'échantillonnage à la fréquence maximale du signal. 2) La formule est un simple "fois deux". 3) Le résultat est une fréquence minimale, une borne inférieure à ne pas franchir.

Le saviez-vous ?

Les premiers travaux théoriques sur l'échantillonnage ont été menés par le mathématicien russe Vladimir Kotelnikov en 1933, avant même Claude Shannon. C'est pourquoi dans la littérature de l'Est, on parle souvent du théorème de Kotelnikov-Shannon.

FAQ

Pourquoi faut-il échantillonner à "strictement plus" que 2*fmax et pas juste "égal" ?

En théorie mathématique pure, échantillonner exactement à 2*fmax peut fonctionner, mais seulement si les instants d'échantillonnage sont parfaitement placés (pas sur les passages à zéro de la sinusoïde). En pratique, pour éviter cette ambiguïté et à cause des filtres non-idéaux, on prend toujours une marge. C'est pourquoi la condition est souvent écrite avec un signe ">" strict.

Résultat Final
La fréquence d'échantillonnage minimale théorique pour numériser le signal audio est de 40 kHz.
A vous de jouer

Un signal de communication téléphonique est limité à une bande passante de 3.4 kHz. Quelle serait sa fréquence d'échantillonnage minimale ?

Question 3 : Comparaison avec la norme CD et justification

Principe

On compare la valeur théorique minimale calculée à la valeur pratique utilisée dans l'industrie (44.1 kHz). La différence n'est pas un hasard et s'explique par les contraintes technologiques des filtres analogiques.

Donnée(s)

Nous utilisons le résultat de la question précédente et la donnée de l'énoncé.

ParamètreSymboleValeurUnité
Fréquence d'échantillonnage minimale\(f_{\text{e, min}}\)40kHz
Fréquence d'échantillonnage (CD)\(f_{\text{e, CD}}\)44.1kHz
Schéma (Avant les calculs)

Visualisons sur un axe la position de la fréquence minimale requise par rapport à celle utilisée en pratique pour les CD.

Comparaison des Fréquences d'Échantillonnage
f (kHz)fe,min = 40fe,CD = 44.1Marge de 4.1 kHz
Réflexions

La fréquence de 44.1 kHz est supérieure à notre minimum de 40 kHz. La condition de Shannon est donc bien respectée. La marge de 4.1 kHz (soit 2.05 kHz entre \(f_{\text{max}}\) = 20 kHz et la fréquence de Nyquist de 22.05 kHz) n'est pas un luxe : elle sert de "bande de garde" (guard band). En pratique, les filtres électroniques ne sont pas parfaits ; ils ne coupent pas les fréquences de manière abrupte. Ils ont une "pente de coupure". Cette bande de garde leur laisse une zone de transition pour atténuer suffisamment les fréquences au-dessus de 20 kHz avant qu'elles ne puissent causer du repliement de spectre.

Schéma (Après les calculs)

Ce schéma illustre la bande de garde créée par la marge de fréquence. Elle donne de l'espace à la "pente de coupure" d'un filtre réaliste pour agir efficacement.

Rôle de la Bande de Garde pour un Filtre Réaliste
Fréquence (kHz)Filtre réalisteSignal UtileBande de Gardef_max=20fe/2=22.05
Le saviez-vous ?

Le choix de 44.1 kHz pour le CD audio est un héritage des premiers enregistreurs numériques qui utilisaient des cassettes vidéo comme support de stockage. 44100 est le produit de 2×3×3×5×5×7×7, ce qui le rendait compatible avec les fréquences de ligne des systèmes vidéo NTSC (américain) et PAL (européen).

Question 4 : Cas d'un sous-échantillonnage

Principe

Le concept physique est celui d'une "illusion d'optique" temporelle. Si l'on observe un objet en mouvement rapide avec des flashs de lumière (stroboscope) trop lents, le mouvement perçu peut être faux. De même, si on "observe" un signal électrique avec des échantillons trop lents, sa fréquence perçue sera fausse. C'est le phénomène d'aliasing.

Mini-Cours

Quand \(f_e < 2f_{\text{signal}}\), l'échantillonneur "rate" des oscillations du signal. Le train d'échantillons résultant, bien que provenant d'un signal haute fréquence, peut parfaitement correspondre à une sinusoïde de plus basse fréquence. Cette basse fréquence est l'alias. Mathématiquement, toutes les fréquences de la forme \(|f_{\text{signal}} - k \cdot f_e|\) (où k est un entier) sont indiscernables après échantillonnage. On retient généralement la plus simple, celle qui se "replie" dans la première zone de Nyquist [0, \(f_e/2\)].

Remarque Pédagogique

Lorsque vous détectez un cas de sous-échantillonnage, visualisez une "ligne de pliage" à la fréquence de Nyquist (\(f_e/2\)). Toute fréquence du signal original qui se trouve au-delà de cette ligne sera "repliée" de l'autre côté, comme si vous pliez une feuille de papier. La distance à la ligne de pliage reste la même.

Normes

Il n'y a pas de norme pour "bien faire" de l'aliasing, car c'est un effet indésirable. Au contraire, toutes les normes de diffusion et d'enregistrement (DVB, ATSC, AES/EBU) imposent des masques de filtrage et des fréquences d'échantillonnage justement pour garantir que ce phénomène n'apparaisse jamais dans le signal utile.

Formule(s)

Calcul de la fréquence alias

\[ f_{\text{alias}} = |f_{\text{signal}} - f_e| \]
Hypothèses

On suppose que le signal d'entrée est une sinusoïde pure (une seule fréquence) pour isoler et calculer l'alias simplement. On suppose également qu'aucun filtre anti-repliement n'est présent, sinon la fréquence de 18 kHz aurait été coupée avant l'échantillonnage.

Donnée(s)

Les données d'entrée pour ce calcul sont les fréquences du signal et de l'échantillonnage.

ParamètreSymboleValeurUnité
Fréquence du signal\(f_{\text{signal}}\)18kHz
Fréquence d'échantillonnage\(f_{e}\)30kHz
Astuces

La méthode du "pliage" est très visuelle : la fréquence de Nyquist est 30/2 = 15 kHz. La fréquence de 18 kHz est 3 kHz au-dessus de cette ligne de pliage (18 - 15 = 3). L'alias se trouvera donc 3 kHz en dessous de la ligne de pliage : 15 - 3 = 12 kHz. C'est un bon moyen de vérifier le calcul.

Schéma (Avant les calculs)

Sur l'axe des fréquences, on voit que la fréquence du signal se trouve dans la zone "interdite" (zone d'aliasing), au-delà de la fréquence de Nyquist.

Position de la Fréquence du Signal vs Nyquist
f (kHz)fe/2 = 15f_sig = 18
Calcul(s)

On vérifie d'abord que la condition n'est pas respectée : \(f_e = 30\,\text{kHz}\), et \(2 \cdot f_{\text{signal}} = 36\,\text{kHz}\). On a bien \(30 < 36\).
On applique ensuite la formule de l'alias.

Calcul de la fréquence alias

\[ \begin{aligned} f_{\text{alias}} &= |f_{\text{signal}} - f_e| \\ &= |18\,\text{kHz} - 30\,\text{kHz}| \\ &= |-12\,\text{kHz}| \\ &= 12\,\text{kHz} \end{aligned} \]
Schéma (Après les calculs)

Ce schéma illustre le repliement. La fréquence de 18 kHz, située à 3 kHz au-delà de la "ligne miroir" de Nyquist, est perçue comme une fréquence située à 3 kHz en deçà, soit 12 kHz.

Visualisation du Repliement de Spectre
f_e/2 = 15kHzOriginal (18kHz)Alias (12kHz)
Réflexions

Un son pur à 18 kHz, qui est très aigu, serait perçu après cette numérisation incorrecte comme un son pur à 12 kHz. La hauteur de la note est faussée, créant une distorsion harmonique indésirable. Ce phénomène est irréversible : une fois l'échantillonnage effectué, il est impossible de savoir si le son à 12 kHz était un vrai 12 kHz ou l'alias d'un 18 kHz.

Points de vigilance

Attention, la formule \(|f_{\text{signal}} - f_e|\) n'est que le cas le plus simple. Si le signal était à 48 kHz, l'alias serait \(|48-30| = 18\,\text{kHz}\), qui se replie encore une fois pour donner \(|18-30|=12\,\text{kHz}\). L'aliasing concerne toutes les "images" du spectre autour des multiples de \(f_e\).

Points à retenir

Maîtriser cette question, c'est retenir que : 1) Le non-respect de Shannon crée des fréquences fantômes (alias). 2) La fréquence de Nyquist (\(f_e/2\)) agit comme un miroir. 3) La formule \(|f_{\text{signal}} - f_e|\) permet de trouver la position de l'alias le plus proche.

Le saviez-vous ?

En infographie et en jeu vidéo, l'aliasing est un phénomène visuel où les lignes obliques ou les bords courbes apparaissent en "escalier" (jaggies). Les techniques "d'anti-aliasing" (FSAA, MSAA) consistent à sur-échantillonner l'image (la calculer à une résolution plus haute) puis à la réduire, ce qui est l'équivalent visuel du filtrage passe-bas en audio.

FAQ

Est-ce que l'aliasing est toujours audible ?

Pas forcément. Si le signal original au-dessus de la fréquence de Nyquist est très faible en amplitude, son alias le sera aussi et pourra être masqué par le reste du signal. Cependant, dans un signal musical complexe, l'aliasing de toutes les harmoniques peut créer un bruit de fond ou une distorsion désagréable et "non musicale".

Résultat Final
Dans ces conditions de sous-échantillonnage, la note pure de 18 kHz sera erronément enregistrée comme une note pure de 12 kHz.
A vous de jouer

Avec la même fréquence d'échantillonnage de 30 kHz, quelle serait la fréquence alias d'un signal à 25 kHz ?

Question 5 : Rôle du filtre anti-repliement

Principe

Puisque le repliement de spectre est irréversible, la seule solution est de s'assurer qu'aucune fréquence "interdite" n'entre dans l'échantillonneur. C'est le rôle du filtre anti-repliement.

Mini-Cours

Un filtre anti-repliement (ou anti-aliasing) est un filtre passe-bas. Son rôle est de couper toutes les fréquences du signal analogique qui sont supérieures à la fréquence de Nyquist (\(f_e/2\)) AVANT que le signal n'atteigne l'échantillonneur. Il garantit ainsi de force que le signal qui sera numérisé respecte la condition de Shannon.

Donnée(s)

La donnée clé pour concevoir le filtre est la fréquence de Nyquist, qui sera sa fréquence de coupure cible. Pour un CD, c'est :

ParamètreSymboleValeurUnité
Fréquence de Nyquist (CD)\(f_e/2\)22.05kHz
Schéma (Avant les calculs)

Le filtre se place impérativement en amont du convertisseur analogique-numérique (CAN) pour traiter le signal tant qu'il est encore analogique.

Chaîne de Numérisation Audio Professionnelle
Signal AnalogiqueFiltre Passe-Bas(Anti-Repliement)Échantillonneur& Quantificateur (CAN)Signal Numérique (PCM)
Schéma (Après les calculs)

Ce diagramme montre la réponse en fréquence d'un filtre anti-repliement idéal. Il agit comme une "porte" qui ne laisse passer que les fréquences autorisées (en vert) et bloque toutes celles qui sont susceptibles de causer de l'aliasing (en rouge).

Réponse Fréquentielle d'un Filtre Anti-Repliement Idéal
fGainBande passante (Fréquences conservées)Bande coupée (Fréquences supprimées)f_c = fe/2

Outil Interactif : Simulateur d'Aliasing

Explorez l'effet de la fréquence d'échantillonnage sur une sinusoïde. Observez le phénomène de repliement de spectre (aliasing) lorsque le critère de Shannon n'est pas respecté. La courbe bleue est le signal original, les points rouges sont les échantillons. Observez comment les points rouges forment une nouvelle onde (l'alias, en pointillé) quand \(f_e < 2 \cdot f_{\text{signal}}\).

Paramètres d'Entrée
5 kHz
44 kHz
Résultats Clés
Condition de Shannon -
Fréquence de Nyquist (\(f_e/2\)) -
Fréquence Apparente (Alias) -

Quiz Final : Testez vos connaissances

1. Quelle est la fréquence d'échantillonnage minimale pour un signal dont la fréquence maximale est de 15 kHz ?

2. Comment nomme-t-on le phénomène de distorsion qui apparaît si \(f_e < 2 \cdot f_{\text{max}}\) ?

3. Où doit être placé un filtre anti-repliement dans une chaîne de numérisation ?

4. La fréquence d'échantillonnage d'un CD est de 44.1 kHz. Quelle est la fréquence audio maximale qu'il peut théoriquement reproduire ?

5. Un signal à 12 kHz est échantillonné à 20 kHz. Quelle est la fréquence alias qui en résulte ?


Glossaire

Fréquence d'échantillonnage (\(f_e\))
Nombre de fois par seconde où un signal analogique est mesuré (échantillonné) lors de sa conversion en signal numérique. Exprimée en Hertz (Hz).
Théorème de Nyquist-Shannon
Principe fondamental du traitement du signal qui énonce que la fréquence d'échantillonnage doit être au moins le double de la fréquence maximale du signal pour éviter la perte d'information.
Repliement de Spectre (Aliasing)
Artefact de distorsion se produisant lors du sous-échantillonnage (\(f_e < 2f_{\text{max}}\)), où les hautes fréquences du signal original apparaissent comme de fausses basses fréquences dans le signal numérisé.
Filtre Anti-Repliement
Filtre passe-bas placé avant l'échantillonneur pour supprimer les fréquences supérieures à la moitié de la fréquence d'échantillonnage, empêchant ainsi l'aliasing.
Application du Théorème de Shannon

D’autres exercices d’électroacoustique:

0 commentaires
Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *