Classification des Cris d’Animaux

Exercice : Classification des Cris d’Animaux en Bioacoustique

Classification des Cris d’Animaux en Bioacoustique

Contexte : L'étude de la BioacoustiqueScience qui étudie les sons produits par les êtres vivants, leur propagation et leur réception..

La bioacoustique est une discipline fascinante qui nous permet d'écouter et de comprendre le monde vivant. Chaque espèce animale produit des sons uniques pour communiquer, se reproduire ou chasser. L'analyse de ces sons, ou "signatures acoustiques", est cruciale pour le suivi de la biodiversité, l'étude du comportement animal et la conservation des espèces. Dans cet exercice, nous allons jouer le rôle de bioacousticiens et utiliser des paramètres simples pour tenter de distinguer automatiquement les cris de deux espèces différentes à partir d'enregistrements de terrain.

Remarque Pédagogique : Cet exercice vous apprendra à extraire des caractéristiques numériques (features) d'un signal biologique et à utiliser ces données pour construire un modèle de classification simple, une compétence fondamentale en analyse de données et en apprentissage automatique (Machine Learning).


Objectifs Pédagogiques

  • Comprendre et définir les paramètres acoustiques de base : durée et bande passante.
  • Calculer ces paramètres à partir de données brutes.
  • Analyser et visualiser des données acoustiques à l'aide d'un graphique de dispersion.
  • Élaborer une règle de classification simple pour distinguer deux catégories.

Données de l'étude

Une campagne d'enregistrements automatiques a été menée dans une zone humide. Après une première analyse, les acousticiens ont isolé 6 cris provenant de deux espèces communes : la Rainette verte (une grenouille) et le Pinson des arbres (un oiseau). Pour chaque cri, ils ont mesuré sa durée ainsi que ses fréquences minimale et maximale sur un spectrogrammeReprésentation visuelle du son qui montre l'intensité des fréquences en fonction du temps..

Exemples de Spectrogrammes
Cri de Rainette (type) Temps (s) Fréquence (kHz) 0 2 4 0 0.1 0.2 Chant de Pinson (type) Temps (s) Fréquence (kHz) 0 2 4 6 0 1 2
ID du Cri Espèce Identifiée Durée (s) Freq. Min (Hz) Freq. Max (Hz)
CRI_01 Rainette verte 0.15 1200 2800
CRI_02 Pinson des arbres 2.10 2500 5500
CRI_03 Rainette verte 0.20 1300 3100
CRI_04 Pinson des arbres 1.95 2200 6000
CRI_05 Rainette verte 0.18 1100 2900
CRI_06 Pinson des arbres 2.30 2800 5900

Questions à traiter

  1. Calculer la bande passante pour chacun des 6 cris.
  2. Présenter l'ensemble des données et de vos calculs dans un nouveau tableau de résultats.
  3. Calculer la durée moyenne et la bande passante moyenne pour chaque espèce.
  4. Créer un graphique de dispersion (nuage de points) montrant la bande passante (axe Y) en fonction de la durée (axe X). Utilisez des couleurs différentes pour chaque espèce.
  5. En observant le graphique, proposez une règle de classification simple (par exemple, basée sur un seuil de durée) qui pourrait permettre de distinguer un cri de Rainette d'un cri de Pinson.

Les bases de l'Analyse Acoustique

Pour analyser un son, on le décompose en caractéristiques mesurables. Les plus simples et les plus informatives sont souvent liées au temps et à la fréquence.

1. Durée du signal
C'est simplement le temps qui s'écoule entre le début et la fin d'un son. On la mesure généralement en secondes (s) ou en millisecondes (ms). C'est un paramètre très intuitif.

2. Fréquence et Bande Passante
La fréquenceNombre d'oscillations d'une onde sonore par seconde, mesurée en Hertz (Hz). Détermine la hauteur d'un son (grave ou aigu). mesure la "hauteur" d'un son. Un son animal n'est jamais une fréquence pure ; il s'étale sur une plage de fréquences. On mesure donc :

  • Fréquence Minimale (\(f_{\text{min}}\)) : La fréquence la plus basse du cri.
  • Fréquence Maximale (\(f_{\text{max}}\)) : La fréquence la plus haute du cri.
La bande passante est l'étendue de cette plage de fréquences. Sa formule est : \[ \text{Bande Passante (Hz)} = f_{\text{max}} - f_{\text{min}} \]


Correction : Classification des Cris d’Animaux

Question 1 : Calculer la bande passante pour chacun des 6 cris.

Principe (le concept physique)

L'objectif est de transformer nos mesures brutes (fréquences min/max) en une nouvelle caractéristique plus informative : la bande passante. Cette caractéristique unique représente la "largeur" spectrale du cri, c'est-à-dire la richesse de sa composition en fréquences, ce qui peut être un puissant indice pour distinguer les espèces.

Mini-Cours (approfondissement théorique)

En analyse de données et en apprentissage automatique, on appelle cela "l'ingénierie des caractéristiques" (feature engineering). On part de données brutes pour créer de nouvelles variables (features) qui aident les algorithmes à mieux "comprendre" et séparer les données. La bande passante est une caractéristique dérivée simple mais très efficace en acoustique.

Remarque Pédagogique (le conseil du professeur)

Une bonne analyse commence rarement par utiliser les données telles quelles. Prenez toujours le temps de réfléchir à comment vous pouvez les combiner ou les transformer pour faire ressortir les informations cachées. Se demander "quelle information cette nouvelle variable m'apporte-t-elle ?" est une excellente habitude à prendre.

Normes (la référence réglementaire)

Non applicable dans ce contexte. L'analyse bioacoustique suit des méthodologies scientifiques publiées et validées par la communauté, mais elle ne dépend pas de normes réglementaires au sens de l'ingénierie de construction.

Formule(s) (l'outil mathématique)

Formule de la Bande Passante

\[ \text{BP} = f_{\text{max}} - f_{\text{min}} \]
Hypothèses (le cadre du calcul)

Pour ce calcul, nous posons les hypothèses suivantes :

  • Les mesures de fréquences minimale et maximale issues du spectrogramme sont considérées comme exactes et non bruitées.
  • Les unités (Hertz) sont cohérentes entre les deux mesures pour chaque cri.
Donnée(s) (les chiffres d'entrée)

Nous utilisons les fréquences minimales et maximales du tableau de l'énoncé pour chaque cri.

ID du CriFreq. Min (Hz)Freq. Max (Hz)
CRI_0112002800
CRI_0225005500
CRI_0313003100
CRI_0422006000
CRI_0511002900
CRI_0628005900
Astuces (Pour aller plus vite)

Pour un grand nombre de cris, ce calcul serait évidemment automatisé dans un tableur ou un script (Python, R...). Pour une vérification mentale rapide, vous pouvez arrondir les fréquences à la centaine ou au millier le plus proche pour obtenir un ordre de grandeur et vérifier que votre résultat final n'est pas aberrant.

Schéma (Avant les calculs)

On peut visualiser la bande passante comme la longueur d'un segment sur l'axe des fréquences. Ce schéma illustre le concept pour un cri générique, avant d'appliquer les valeurs numériques.

Représentation de la Bande Passante
Fréquence (Hz)f-minf-maxBande Passante
Calcul(s) (l'application numérique)

On applique la formule pour chaque ligne du tableau de données fourni dans l'énoncé.

Bande Passante pour CRI_01

\[ \begin{aligned} \text{BP}_{\text{CRI\_01}} &= 2800 \, \text{Hz} - 1200 \, \text{Hz} \\ &= 1600 \, \text{Hz} \end{aligned} \]

Bande Passante pour CRI_02

\[ \begin{aligned} \text{BP}_{\text{CRI\_02}} &= 5500 \, \text{Hz} - 2500 \, \text{Hz} \\ &= 3000 \, \text{Hz} \end{aligned} \]

Bande Passante pour CRI_03

\[ \begin{aligned} \text{BP}_{\text{CRI\_03}} &= 3100 \, \text{Hz} - 1300 \, \text{Hz} \\ &= 1800 \, \text{Hz} \end{aligned} \]

Bande Passante pour CRI_04

\[ \begin{aligned} \text{BP}_{\text{CRI\_04}} &= 6000 \, \text{Hz} - 2200 \, \text{Hz} \\ &= 3800 \, \text{Hz} \end{aligned} \]

Bande Passante pour CRI_05

\[ \begin{aligned} \text{BP}_{\text{CRI\_05}} &= 2900 \, \text{Hz} - 1100 \, \text{Hz} \\ &= 1800 \, \text{Hz} \end{aligned} \]

Bande Passante pour CRI_06

\[ \begin{aligned} \text{BP}_{\text{CRI\_06}} &= 5900 \, \text{Hz} - 2800 \, \text{Hz} \\ &= 3100 \, \text{Hz} \end{aligned} \]
Schéma (Après les calculs)

Pour visualiser les résultats, un diagramme en barres est efficace. Chaque barre représente la bande passante calculée pour un cri, permettant une comparaison directe.

Bandes Passantes Calculées par Cri
Bande Passante (Hz)020004000CRI_011.6kCRI_023.0kCRI_031.8kCRI_043.8kCRI_051.8kCRI_063.1k
Réflexions (l'interprétation du résultat)

Les valeurs de bande passante calculées semblent se regrouper en deux catégories distinctes. Trois des cris ont une bande passante inférieure à 2000 Hz (1600, 1800, 1800), tandis que les trois autres ont une bande passante bien supérieure, égale ou supérieure à 3000 Hz (3000, 3800, 3100). Cette première observation suggère que cette nouvelle caractéristique est potentiellement très utile pour distinguer nos deux espèces.

Points de vigilance (les erreurs à éviter)

La principale source d'erreur dans ce type de calcul est un oubli de conversion d'unités. Ici, toutes les fréquences sont en Hertz (Hz), le calcul est donc direct. Si certaines données étaient en kilohertz (kHz), il aurait été impératif de tout convertir dans la même unité avant la soustraction pour éviter une erreur majeure.

Points à retenir (permettre a l'apprenant de maitriser la question)

Pour maîtriser cette question, retenez les points suivants :

  • La bande passante est une caractéristique dérivée, créée à partir de données brutes.
  • Elle quantifie la richesse ou l'étendue fréquentielle d'un son.
  • Sa formule est une simple soustraction : \(BP = f_{\text{max}} - f_{\text{min}}\).
Le saviez-vous ? (la culture de l'ingénieur)

Les chauves-souris sont des maîtres de la modulation de la bande passante. Pour la recherche de proies, elles émettent des ultrasons à bande étroite pour maximiser la portée. Mais au moment de l'attaque, elles passent à des signaux à très large bande passante pour obtenir une "image" acoustique de leur cible avec une résolution maximale !

FAQ (pour lever les doutes)

Voici quelques questions fréquentes pour cette étape.

Résultat Final (la conclusion chiffrée)
Les bandes passantes calculées pour les cris 1 à 6 sont respectivement : 1600 Hz, 3000 Hz, 1800 Hz, 3800 Hz, 1800 Hz, et 3100 Hz.
A vous de jouer (pour verifier la comprehension de l'etudiant parrapport a la question)

Vous analysez un nouveau cri avec une fréquence minimale de 1.5 kHz et une fréquence maximale de 3200 Hz. Quelle est sa bande passante en Hz ? (Attention au piège !)

Question 2 : Présenter l'ensemble des données dans un nouveau tableau de résultats.

Principe

Il s'agit de synthétiser les données initiales et les résultats de la première question dans un tableau unique pour faciliter l'analyse.

Résultat Final
Le tableau ci-dessous regroupe toutes les informations nécessaires pour la suite de l'exercice.
ID du CriEspèceDurée (s)Freq. Min (Hz)Freq. Max (Hz)Bande Passante (Hz)
CRI_01Rainette verte0.15120028001600
CRI_02Pinson des arbres2.10250055003000
CRI_03Rainette verte0.20130031001800
CRI_04Pinson des arbres1.95220060003800
CRI_05Rainette verte0.18110029001800
CRI_06Pinson des arbres2.30280059003100

Question 3 : Calculer la durée moyenne et la bande passante moyenne pour chaque espèce.

Principe (le concept physique)

L'objectif est de synthétiser et de résumer les caractéristiques de chaque groupe (espèce) en calculant une valeur centrale : la moyenne. Cela permet de passer de la comparaison de six cris individuels à la comparaison de deux "profils acoustiques typiques". Cette simplification est la première étape de toute modélisation statistique.

Mini-Cours (approfondissement théorique)

La moyenne arithmétique est la mesure de tendance centrale la plus commune. Elle représente le "centre de gravité" d'un ensemble de données. En regroupant les données par catégorie (ici, l'espèce) et en calculant la moyenne pour chaque groupe, on réalise une analyse descriptive de base qui permet de quantifier à quel point les groupes sont différents les uns des autres en moyenne.

Remarque Pédagogique (le conseil du professeur)

En analyse de données, passer des données brutes à des statistiques descriptives (comme la moyenne, l'écart-type, la médiane...) est une étape cruciale. Ne sautez jamais directement à la modélisation complexe. Prenez le temps de "sentir" vos données en calculant ces indicateurs simples. Ils vous racontent souvent 80% de l'histoire !

Normes (la référence réglementaire)

Non applicable. Les calculs statistiques suivent des définitions mathématiques universelles.

Formule(s) (l'outil mathématique)

Formule de la Moyenne Arithmétique

\[ \begin{aligned} \text{Moyenne} (\bar{x}) &= \frac{\sum_{i=1}^{n} x_i}{n} \\ &= \frac{x_1 + x_2 + ... + x_n}{n} \end{aligned} \]
Hypothèses (le cadre du calcul)

L'hypothèse fondamentale ici est que notre échantillon de 3 cris par espèce est représentatif du comportement acoustique général de cette espèce. En réalité, un échantillon aussi petit est très sensible à la variabilité individuelle et ne permettrait pas de tirer des conclusions scientifiques robustes. Pour cet exercice, nous l'admettons.

Donnée(s) (les chiffres d'entrée)

Nous utilisons les données du tableau complété à la question 2, en les séparant par espèce.

Données pour la Rainette verte (n=3) :

  • Durées (s) : 0.15, 0.20, 0.18
  • Bandes Passantes (Hz) : 1600, 1800, 1800

Données pour le Pinson des arbres (n=3) :

  • Durées (s) : 2.10, 1.95, 2.30
  • Bandes Passantes (Hz) : 3000, 3800, 3100
Astuces (Pour aller plus vite)

Avec seulement trois valeurs, il n'y a pas vraiment de raccourci. Cependant, pour la bande passante du Pinson (3000, 3800, 3100), vous pouvez remarquer que 3000 et 3100 sont proches. Leur moyenne est ~3050. La moyenne de l'ensemble sera donc un peu au-dessus de 3050, tirée vers le haut par 3800. Cela permet d'anticiper l'ordre de grandeur du résultat (~3300).

Schéma (Avant les calculs)

Ce schéma illustre le concept de moyenne. On positionne les trois mesures de durée pour une espèce sur un axe, et on identifie leur "centre de gravité", qui est la valeur moyenne.

Concept du Calcul de la Moyenne
Valeurx₁x₂x₃Moyenne
Calcul(s) (l'application numérique)

On applique la formule de la moyenne à chaque groupe de données.

Durée moyenne pour la Rainette verte

\[ \begin{aligned} \text{Durée}_{\text{moyenne}} &= \frac{0.15 \, \text{s} + 0.20 \, \text{s} + 0.18 \, \text{s}}{3} \\ &= \frac{0.53 \, \text{s}}{3} \\ &\approx 0.177 \, \text{s} \end{aligned} \]

Bande Passante moyenne pour la Rainette verte

\[ \begin{aligned} \text{BP}_{\text{moyenne}} &= \frac{1600 \, \text{Hz} + 1800 \, \text{Hz} + 1800 \, \text{Hz}}{3} \\ &= \frac{5200 \, \text{Hz}}{3} \\ &\approx 1733 \, \text{Hz} \end{aligned} \]

Durée moyenne pour le Pinson des arbres

\[ \begin{aligned} \text{Durée}_{\text{moyenne}} &= \frac{2.10 \, \text{s} + 1.95 \, \text{s} + 2.30 \, \text{s}}{3} \\ &= \frac{6.35 \, \text{s}}{3} \\ &\approx 2.117 \, \text{s} \end{aligned} \]

Bande Passante moyenne pour le Pinson des arbres

\[ \begin{aligned} \text{BP}_{\text{moyenne}} &= \frac{3000 \, \text{Hz} + 3800 \, \text{Hz} + 3100 \, \text{Hz}}{3} \\ &= \frac{9900 \, \text{Hz}}{3} \\ &= 3300 \, \text{Hz} \end{aligned} \]
Schéma (Après les calculs)

Un diagramme en barres est idéal pour visualiser et comparer les moyennes des deux groupes. Il permet de voir immédiatement l'ampleur des différences entre les espèces pour chaque caractéristique.

Comparaison des Moyennes Acoustiques
Réflexions (l'interprétation du résultat)

L'analyse des moyennes révèle une différence drastique entre les deux espèces. La durée moyenne d'un chant de Pinson (\(\approx 2.12 \, \text{s}\)) est plus de 10 fois supérieure à celle d'un cri de Rainette (\(\approx 0.18 \, \text{s}\)). De même, la bande passante moyenne du Pinson (\(3300 \, \text{Hz}\)) est presque deux fois plus grande que celle de la Rainette (\(\approx 1733 \, \text{Hz}\)). Cette forte séparation des valeurs moyennes confirme que nos deux caractéristiques sont très efficaces pour distinguer ces espèces.

Points de vigilance (les erreurs à éviter)

Le point de vigilance majeur ici est la taille de l'échantillon. La moyenne est très sensible aux valeurs extrêmes (aberrantes). Avec seulement 3 cris, si l'un d'eux avait été mal mesuré ou atypique, notre moyenne aurait été fortement faussée. En recherche, des conclusions ne sont jamais tirées sur des échantillons aussi faibles.

Points à retenir (permettre a l'apprenant de maitriser la question)

Pour maîtriser cette question, vous devez savoir :

  • Regrouper les données par catégorie avant tout calcul de statistique par groupe.
  • Appliquer la formule de la moyenne arithmétique.
  • Interpréter la comparaison des moyennes : de grandes différences suggèrent que la caractéristique est utile pour séparer les groupes.
Le saviez-vous ? (la culture de l'ingénieur)

Les bioacousticiens qui étudient les cétacés (baleines, dauphins) utilisent des moyennes calculées sur des milliers de chants pour suivre les populations. Ils ont découvert que certaines populations de baleines à bosse changent radicalement leur chant d'une année sur l'autre, adoptant une nouvelle "mode" musicale qui se propage à travers les océans comme un tube planétaire !

FAQ (pour lever les doutes)

Voici quelques questions fréquentes pour cette étape.

Résultat Final (la conclusion chiffrée)
  • Profil moyen de la Rainette verte : Durée \(\approx\) 0.18 s | Bande passante \(\approx\) 1733 Hz.
  • Profil moyen du Pinson des arbres : Durée \(\approx\) 2.12 s | Bande passante = 3300 Hz.
A vous de jouer (pour verifier la comprehension de l'etudiant parrapport a la question)

Un 4ème cri de Pinson est enregistré : Durée = 2.55s, BP = 3500 Hz. Recalculez la durée moyenne pour le Pinson des arbres avec ce nouveau cri (il y a maintenant 4 cris).

Question 4 : Créer un graphique de dispersion.

Principe

Visualiser les données dans un espace à deux dimensions (durée et bande passante) pour observer si les cris de chaque espèce se regroupent dans des zones distinctes du graphique. Si c'est le cas, cela signifie que ces deux caractéristiques sont efficaces pour les séparer.

Donnée(s)

On utilise les colonnes "Durée" et "Bande Passante" du tableau de la question 2.

EspèceDurée (s)Bande Passante (Hz)
Rainette verte0.151600
Pinson des arbres2.103000
Rainette verte0.201800
Pinson des arbres1.953800
Rainette verte0.181800
Pinson des arbres2.303100
Schéma (Avant les calculs)

Avant de placer les points de données, on prépare le canevas du graphique : un repère avec deux axes gradués. L'axe horizontal (abscisse) représentera la durée, et l'axe vertical (ordonnée) la bande passante.

Canevas du Graphique de Dispersion
Durée (s)Bande Passante (Hz)02k4k6k0.00.51.01.52.0
Schéma (Après les calculs)

On place chaque cri comme un point sur le graphique, avec sa durée en abscisse (axe des x) et sa bande passante en ordonnée (axe des y). Ce type de visualisation est essentiel en analyse de données pour identifier des structures ou des groupes.

Bande Passante vs. Durée des Cris
Durée (s)Bande Passante (Hz)02k4k6k0.00.51.01.52.0 Rainette vertePinson des arbres
Réflexions

Le graphique montre très clairement deux groupes de points distincts. Les cris de Rainette (en vert) sont tous regroupés en bas à gauche (durée courte, bande passante faible). Les cris de Pinson (en orange) sont regroupés en haut à droite (durée longue, bande passante élevée). Il n'y a aucun chevauchement, ce qui indique que ces deux paramètres sont très efficaces pour les différencier.

Question 5 : Proposer une règle de classification simple.

Principe

En se basant sur la séparation visuelle observée sur le graphique, on cherche à définir une frontière simple (une ligne) qui sépare les deux groupes. La règle de classification formalise cette frontière.

Réflexions

On observe que tous les cris de Rainette ont une durée inférieure à 0.2 s, tandis que tous les cris de Pinson ont une durée supérieure à 1.9 s. La durée seule semble être un critère suffisant et très efficace. On peut choisir n'importe quelle valeur de seuil entre 0.2 s et 1.95 s. Un seuil à 1.0 seconde est un choix simple et robuste.

Schéma (Après les calculs)

Ce schéma reprend le nuage de points précédent et y ajoute une ligne verticale. Cette ligne représente notre "frontière de décision". Tout point tombant à gauche de cette ligne sera classé comme "Rainette", et tout point à droite sera classé comme "Pinson".

Visualisation de la Règle de Classification
Durée (s)Bande Passante (Hz)02k4k6k0.00.51.01.52.0Zone "Rainette"Zone "Pinson"
A vous de jouer

La meilleure façon d'apprendre, c'est de pratiquer ! Et si un nouveau cri (CRI_07) avait une durée de 0.8 s et une bande passante de 2200 Hz, à quelle espèce l'attribueriez-vous avec notre règle ?

Résultat Final
Une règle de classification simple et efficace est : Si la durée du cri est inférieure à 1.0 seconde, alors il s'agit d'une Rainette verte. Sinon, il s'agit d'un Pinson des arbres.

Outil Interactif : Simulateur de Classification

Utilisez les curseurs pour définir la durée et la bande passante d'un nouveau cri. Le simulateur appliquera la règle de classification que nous avons définie et mettra à jour le graphique pour voir où se situe votre cri.

Paramètres du nouveau cri
0.8 s
2200 Hz
Résultat de la Classification
Règle appliquée Durée < 1.0 s ?
Espèce prédite -

Quiz Final : Testez vos connaissances

1. Qu'est-ce que la bande passante d'un son ?

2. D'après les résultats de l'exercice, quelle caractéristique est la plus discriminante pour séparer nos deux espèces ?

3. Un spectrogramme représente...

4. Si un nouveau cri de Pinson était enregistré, où vous attendriez-vous à le trouver sur le graphique de dispersion ?

5. À quoi sert principalement la bioacoustique dans le monde réel ?


Glossaire

Bioacoustique
Science qui étudie les sons d'origine biologique (produits par les animaux, les humains...), leur mécanisme de production, leur propagation dans le milieu et leur réception par les organismes.
Bande Passante
L'intervalle de fréquences sur lequel un son est émis. Il est calculé comme la différence entre la fréquence la plus haute et la fréquence la plus basse du signal.
Fréquence
Mesure de la hauteur d'un son, exprimée en Hertz (Hz). Une fréquence basse correspond à un son grave, une fréquence haute à un son aigu.
Spectrogramme
Une représentation visuelle du son qui montre l'évolution du spectre de fréquences d'un signal au cours du temps. Le temps est en abscisse, la fréquence en ordonnée, et l'intensité du son par une couleur.
Exercice : Classification des Cris d’Animaux

D’autres exercices de Bioacoustique:

Étude de la Plasticité Auditive
Étude de la Plasticité Auditive

Plasticité du Système Auditif en Bioacoustique Étude de la Plasticité Auditive en Bioacoustique Contexte : L'adaptation des systèmes sensoriels à l'environnement. La plasticité neuronaleCapacité du système nerveux à modifier sa structure et sa fonction en réponse à...

0 commentaires
Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *