Numérique et Sciences Informatiques > Préparation aux Épreuves du Baccalauréat NSI > Révisions Thématiques > Représentation des données

Révision : Représentation des données en NSI

Révision complète sur la représentation des données pour l'épreuve du Baccalauréat NSI. Apprenez à manipuler et comprendre les différents formats de données.

Introduction à la représentation des données

La représentation des données est un pilier fondamental de l'informatique. Elle concerne la manière dont l'information est stockée et manipulée par les ordinateurs. Comprendre ces représentations est essentiel pour le développement de logiciels efficaces et la résolution de problèmes complexes.

Dans le contexte du Baccalauréat NSI, vous devez maîtriser les différentes manières de représenter les nombres (entiers, flottants), les caractères (ASCII, Unicode), les images, les sons, et les données structurées (tableaux, listes, dictionnaires). Cette connaissance vous permettra de concevoir des algorithmes adaptés et d'interpréter correctement les résultats de vos programmes.

Représentation des nombres entiers

Les nombres entiers peuvent être représentés de différentes manières en informatique. La représentation la plus courante est la représentation binaire, où chaque nombre est exprimé en base 2 (0 et 1).

Représentation non signée: Les entiers non signés représentent uniquement des valeurs positives ou nulles. La plage de valeurs possibles dépend du nombre de bits utilisés. Par exemple, avec 8 bits, on peut représenter les nombres de 0 à 255 (28 - 1).

Représentation signée (Complément à deux): Pour représenter les nombres négatifs, on utilise souvent le complément à deux. Le bit de poids fort (le bit le plus à gauche) indique le signe (0 pour positif, 1 pour négatif). Pour obtenir le complément à deux d'un nombre négatif, on inverse tous les bits du nombre positif correspondant et on ajoute 1.

Exemple: Représentation de -5 sur 8 bits:

  1. Représentation de 5: 00000101
  2. Inversion des bits: 11111010
  3. Ajout de 1: 11111011
Donc, -5 est représenté par 11111011 en complément à deux.

Représentation des nombres flottants

Les nombres flottants sont utilisés pour représenter les nombres réels (nombres avec une partie décimale). La norme IEEE 754 est la plus utilisée pour la représentation des nombres flottants.

Un nombre flottant est représenté par trois parties:

  1. Signe: Indique si le nombre est positif ou négatif (1 bit).
  2. Exposant: Représente la puissance de 2 par laquelle la mantisse doit être multipliée (8 ou 11 bits). Il est biaisé pour pouvoir représenter des exposants négatifs.
  3. Mantisse: Représente la partie fractionnaire du nombre (23 ou 52 bits). Elle est normalisée, c'est-à-dire qu'elle commence par un 1 implicite.

Exemple: Représentation simplifiée d'un nombre flottant:
+1.m x 2(e - biais)

Il est important de comprendre que la représentation des nombres flottants est approximative. Cela peut entraîner des erreurs d'arrondi lors des calculs.

Représentation des caractères

Les caractères (lettres, chiffres, symboles) sont représentés par des codes numériques. Les deux principaux systèmes de codage sont ASCII et Unicode.

ASCII (American Standard Code for Information Interchange): Utilisait 7 bits pour représenter 128 caractères (lettres majuscules et minuscules, chiffres, symboles de ponctuation, caractères de contrôle). Les versions étendues d'ASCII utilisent 8 bits pour représenter 256 caractères, incluant des caractères accentués et spéciaux.

Unicode: Un standard plus récent qui utilise plus de bits (jusqu'à 4 octets) pour représenter un plus grand nombre de caractères, incluant les caractères de différentes langues (chinois, japonais, arabe, etc.). UTF-8 est une forme courante d'encodage Unicode, compatible avec ASCII.

Exemple: 'A' est représenté par le code ASCII 65 (01000001 en binaire). L'euro (€) est représenté par le code Unicode U+20AC.

Représentation des images

Les images numériques sont représentées par une matrice de pixels. Chaque pixel représente une couleur. Il existe différents formats de représentation des images:

Images bitmap (BMP): Stockent la couleur de chaque pixel individuellement. Elles peuvent être non compressées ou compressées sans perte.

Images JPEG: Utilisent une compression avec perte pour réduire la taille du fichier. Elles sont adaptées aux photographies.

Images PNG: Utilisent une compression sans perte. Elles sont adaptées aux images avec des zones de couleurs uniformes (logos, graphiques).

Exemple: Une image en noir et blanc peut être représentée par une matrice de 0 et de 1, où 0 représente le noir et 1 représente le blanc.

La profondeur de couleur (le nombre de bits utilisés pour représenter chaque pixel) détermine le nombre de couleurs possibles. Par exemple, une image en couleurs vraies (24 bits) peut représenter 16,7 millions de couleurs.

Représentation du son

Le son est une onde analogique. Pour être stocké et manipulé par un ordinateur, il doit être numérisé. La numérisation consiste à échantillonner le signal sonore à intervalles réguliers et à quantifier l'amplitude de chaque échantillon.

Échantillonnage: Le nombre d'échantillons par seconde est appelé fréquence d'échantillonnage (ex: 44100 Hz pour les CD audio). Plus la fréquence d'échantillonnage est élevée, meilleure est la qualité du son.

Quantification: Le nombre de bits utilisés pour représenter chaque échantillon détermine la précision de la quantification. Par exemple, 16 bits permettent de représenter 65536 niveaux d'amplitude.

Exemple: Un fichier audio WAV stocke les échantillons non compressés. Un fichier audio MP3 utilise une compression avec perte pour réduire la taille du fichier.

Représentation des données structurées

Les données structurées (tableaux, listes, dictionnaires) sont utilisées pour organiser et manipuler l'information de manière efficace.

Tableaux: Un tableau est une collection ordonnée d'éléments de même type. Chaque élément est accessible par son indice (sa position dans le tableau).

Listes (chaînes): Une liste est une collection ordonnée d'éléments de types différents. Les listes peuvent être dynamiques (leur taille peut varier).

Dictionnaires (tables associatives): Un dictionnaire est une collection de paires clé-valeur. Chaque clé est associée à une valeur. Les dictionnaires permettent d'accéder rapidement à une valeur à partir de sa clé.

Exemple: Un tableau peut représenter les notes d'un élève à différents examens. Une liste peut représenter le nom, le prénom et l'âge d'une personne. Un dictionnaire peut représenter les informations d'un produit (nom, prix, description).

Ce qu'il faut retenir

  • Les nombres entiers peuvent être représentés en binaire, en utilisant le complément à deux pour les nombres négatifs.
  • Les nombres flottants sont représentés selon la norme IEEE 754, avec un signe, un exposant et une mantisse.
  • Les caractères sont représentés par des codes numériques (ASCII, Unicode).
  • Les images sont représentées par une matrice de pixels.
  • Le son est numérisé en échantillonnant et en quantifiant le signal.
  • Les données structurées (tableaux, listes, dictionnaires) permettent d'organiser et de manipuler l'information.
  • Comprendre les limitations des différentes représentations (erreurs d'arrondi pour les flottants, limitations du nombre de caractères pour ASCII) est crucial.

FAQ

  • Quelle est la différence entre ASCII et Unicode ?

    ASCII est un standard de codage de caractères qui utilise 7 ou 8 bits, permettant de représenter un nombre limité de caractères (128 ou 256). Unicode, en revanche, utilise plus de bits (jusqu'à 4 octets) et peut représenter un beaucoup plus grand nombre de caractères, incluant ceux de différentes langues.
  • Pourquoi la représentation des nombres flottants est-elle approximative ?

    La représentation des nombres flottants est approximative car elle utilise un nombre limité de bits pour représenter une infinité de nombres réels. Cela entraîne des erreurs d'arrondi lors des calculs.