Numérique et Sciences Informatiques > Représentation des Données : Types et Encodage > Représentation Numérique des Images, Sons et Vidéos > Sons numériques (échantillonnage, quantification)
Sons Numériques : Échantillonnage et Quantification
Comprendre le processus de conversion d'un signal sonore analogique en un signal numérique, en détaillant les étapes d'échantillonnage et de quantification. Ce cours aborde les notions de fréquence d'échantillonnage, de résolution et de leurs impacts sur la qualité sonore.
Introduction au Son Numérique
Le son, tel que nous l'entendons, est une vibration de l'air, c'est-à-dire une onde analogique. Pour qu'un ordinateur puisse manipuler un son, il faut le convertir en une forme numérique. Ce processus implique deux étapes principales : l'échantillonnage et la quantification. On peut imaginer ce processus comme prendre des 'photos' du signal sonore à intervalles réguliers, puis mesurer la hauteur de chaque 'photo'.
Échantillonnage
L'échantillonnage consiste à mesurer l'amplitude du signal sonore à des intervalles réguliers. La fréquence à laquelle ces mesures sont prises est appelée fréquence d'échantillonnage, mesurée en Hertz (Hz). Par exemple, une fréquence d'échantillonnage de 44100 Hz (utilisée pour les CDs audio) signifie que l'amplitude du signal est mesurée 44100 fois par seconde.
Le théorème de Nyquist-Shannon stipule que la fréquence d'échantillonnage doit être au moins deux fois supérieure à la fréquence maximale du signal à échantillonner pour éviter le phénomène d'aliasing (repliement de spectre). L'aliasing se produit lorsque les hautes fréquences sont mal interprétées et apparaissent comme des fréquences plus basses, ce qui déforme le son. L'oreille humaine peut entendre des sons jusqu'à environ 20 kHz, c'est pourquoi une fréquence d'échantillonnage d'au moins 40 kHz est nécessaire (et 44.1 kHz est une norme).
Exemple concret : Imaginez une hélice qui tourne. Si vous prenez des photos de l'hélice trop lentement, elle pourrait sembler tourner dans le sens inverse ou même rester immobile sur les photos. L'échantillonnage est similaire : si vous n'échantillonnez pas assez rapidement, vous ne pourrez pas représenter fidèlement le signal sonore.
Quantification
La quantification consiste à attribuer une valeur numérique à chaque échantillon. Comme les ordinateurs fonctionnent avec des nombres binaires, l'amplitude de chaque échantillon est arrondie à la valeur discrète la plus proche parmi un ensemble de valeurs possibles. Le nombre de valeurs possibles est déterminé par la résolution (ou profondeur de bits).
Une résolution de 8 bits permet 28 = 256 valeurs possibles. Une résolution de 16 bits permet 216 = 65536 valeurs possibles. Plus la résolution est élevée, plus la représentation du signal est précise et moins il y a de bruit de quantification (erreur due à l'arrondissement). Le bruit de quantification se manifeste comme un léger sifflement ou grésillement dans le son.
Exemple concret : Imaginez que vous mesurez la hauteur de personnes avec une règle. Si la règle n'a que des graduations tous les 10 cm, vous ne pourrez pas mesurer la hauteur avec une précision au centimètre près. La quantification est similaire : plus vous avez de 'graduations' (niveaux de quantification), plus votre mesure de l'amplitude du signal sera précise.
Impact de l'Échantillonnage et de la Quantification sur la Qualité Sonore
La fréquence d'échantillonnage et la résolution déterminent la qualité du son numérique. Une fréquence d'échantillonnage plus élevée permet de capturer des fréquences plus hautes, tandis qu'une résolution plus élevée réduit le bruit de quantification.
Tableau récapitulatif :Paramètre Impact sur la qualité sonore Fréquence d'échantillonnage Détermine la bande passante du son (gamme de fréquences reproduites). Une fréquence plus élevée capture des sons plus aigus. Résolution (profondeur de bits) Détermine la plage dynamique (différence entre le son le plus faible et le son le plus fort pouvant être représentés) et le niveau de bruit de quantification. Une résolution plus élevée réduit le bruit.
Le choix de la fréquence d'échantillonnage et de la résolution dépend de l'application. Pour de la musique de haute qualité, des valeurs élevées sont préférables. Pour des applications où la taille du fichier est importante (par exemple, pour des sonneries de téléphone), des valeurs plus basses peuvent être utilisées, au détriment de la qualité.
Formats de Fichiers Audio
Il existe de nombreux formats de fichiers audio, chacun avec ses propres caractéristiques en termes de compression, de qualité et de taille de fichier. Certains formats sont non compressés (comme WAV et AIFF), ce qui signifie qu'ils conservent toute l'information du son original, mais prennent plus de place. D'autres formats sont compressés (comme MP3, AAC et Ogg Vorbis), ce qui réduit la taille du fichier en supprimant certaines informations (jugées moins importantes par des algorithmes psychoacoustiques). La compression peut être avec perte (lossy) ou sans perte (lossless). La compression avec perte (MP3) réduit davantage la taille du fichier, mais dégrade légèrement la qualité du son. La compression sans perte (FLAC, ALAC) réduit la taille du fichier sans perte de qualité.
Ce qu'il faut retenir
FAQ
-
Pourquoi utiliser une fréquence d'échantillonnage plus élevée que 40 kHz si l'oreille humaine n'entend pas au-delà de 20 kHz ?
Bien que l'oreille humaine n'entende pas au-delà de 20 kHz, utiliser une fréquence d'échantillonnage plus élevée (comme 44.1 kHz ou 48 kHz) permet de simplifier la conception des filtres anti-aliasing, qui sont nécessaires pour éliminer les fréquences supérieures à la moitié de la fréquence d'échantillonnage avant la conversion analogique-numérique. De plus, certains équipements audio et certains processus de traitement du son peuvent bénéficier de la présence de fréquences plus élevées. -
Quelle est la différence entre un fichier MP3 et un fichier WAV ?
Un fichier WAV est un format non compressé (ou compressé sans perte), ce qui signifie qu'il conserve toute l'information du son original. Un fichier MP3 est un format compressé avec perte, ce qui signifie qu'il réduit la taille du fichier en supprimant certaines informations (jugées moins importantes par des algorithmes psychoacoustiques). Un fichier MP3 est plus petit qu'un fichier WAV, mais la qualité du son est légèrement inférieure.