Mathématiques > Probabilités et Statistiques > Statistiques > Représentations graphiques (histogrammes, diagrammes circulaires, boîtes à moustaches)

Comprendre et Interpréter les Représentations Graphiques: Histogrammes, Diagrammes Circulaires et Boîtes à Moustaches

Ce guide détaillé explique comment construire, interpréter et utiliser les histogrammes, les diagrammes circulaires et les boîtes à moustaches pour analyser des données statistiques. Des exemples concrets et des exercices pratiques sont inclus pour faciliter l'apprentissage.

Introduction aux Représentations Graphiques

Les représentations graphiques sont des outils essentiels pour visualiser et interpréter des données statistiques. Elles permettent de résumer et de présenter des informations complexes de manière claire et concise. Parmi les représentations graphiques les plus courantes, on trouve les histogrammes, les diagrammes circulaires et les boîtes à moustaches. Chacune de ces représentations est adaptée à un type de données et offre une perspective différente sur la distribution des données.

Les Histogrammes

Qu'est-ce qu'un histogramme? Un histogramme est un diagramme en bâtons qui représente la distribution de fréquences d'une variable continue. Il est particulièrement utile pour visualiser la forme de la distribution, identifier les valeurs centrales et les valeurs aberrantes.

Construction d'un histogramme:

  1. Diviser les données en classes: Regroupez les données en intervalles de classe de taille égale (par exemple, 0-10, 10-20, 20-30).
  2. Calculer la fréquence de chaque classe: Comptez le nombre de données qui appartiennent à chaque classe.
  3. Représenter graphiquement: Dessinez un rectangle pour chaque classe, dont la hauteur est proportionnelle à la fréquence de la classe. Les rectangles sont adjacents, sans espace entre eux.

Exemple: Supposons que nous ayons les notes d'un examen pour 20 étudiants: 5, 7, 12, 15, 18, 8, 10, 14, 16, 9, 11, 13, 17, 6, 19, 4, 20, 3, 1, 2. Nous pouvons regrouper ces notes en classes de taille 5 (0-5, 5-10, 10-15, 15-20) et construire un histogramme pour visualiser la distribution des notes.

Interprétation: Un histogramme permet d'identifier rapidement si une distribution est symétrique, asymétrique (étirée vers la gauche ou la droite), unimodale (un seul pic) ou multimodale (plusieurs pics).

Les Diagrammes Circulaires

Qu'est-ce qu'un diagramme circulaire? Un diagramme circulaire (ou camembert) est une représentation graphique qui divise un cercle en secteurs, chaque secteur représentant une proportion d'un ensemble de données. Il est particulièrement adapté pour visualiser la composition d'un ensemble, c'est-à-dire la part de chaque catégorie dans le total.

Construction d'un diagramme circulaire:

  1. Calculer la proportion de chaque catégorie: Divisez le nombre d'éléments dans chaque catégorie par le nombre total d'éléments.
  2. Calculer l'angle de chaque secteur: Multipliez la proportion de chaque catégorie par 360 degrés.
  3. Représenter graphiquement: Dessinez un cercle et divisez-le en secteurs, chaque secteur ayant l'angle correspondant à la proportion de sa catégorie.

Exemple: Supposons que nous ayons les données sur le type d'ordinateurs utilisés par 100 étudiants: 40 utilisent des ordinateurs portables, 30 utilisent des ordinateurs de bureau et 30 utilisent des tablettes. Nous pouvons construire un diagramme circulaire pour visualiser la proportion de chaque type d'ordinateur. Le secteur correspondant aux ordinateurs portables aura un angle de (40/100) * 360 = 144 degrés.

Interprétation: Un diagramme circulaire permet de comparer rapidement la taille relative des différentes catégories d'un ensemble de données.

Les Boîtes à Moustaches (Box Plots)

Qu'est-ce qu'une boîte à moustaches? Une boîte à moustaches est une représentation graphique qui résume la distribution d'une variable quantitative à l'aide de cinq statistiques clés: le minimum, le premier quartile (Q1), la médiane (Q2), le troisième quartile (Q3) et le maximum. Elle permet de visualiser rapidement la dispersion, la symétrie et la présence de valeurs aberrantes.

Construction d'une boîte à moustaches:

  1. Calculer les statistiques clés: Ordonnez les données et déterminez le minimum, le premier quartile (Q1), la médiane (Q2), le troisième quartile (Q3) et le maximum. Le premier quartile est la valeur qui sépare les 25% inférieurs des données du reste, la médiane est la valeur centrale et le troisième quartile est la valeur qui sépare les 75% inférieurs des données du reste.
  2. Dessiner la boîte: Dessinez une boîte qui s'étend du premier quartile (Q1) au troisième quartile (Q3). La longueur de la boîte représente l'écart interquartile (IQR = Q3 - Q1).
  3. Dessiner la médiane: Tracez une ligne à l'intérieur de la boîte pour indiquer la médiane (Q2).
  4. Dessiner les moustaches: Dessinez des lignes (moustaches) qui s'étendent de chaque extrémité de la boîte jusqu'aux valeurs les plus éloignées qui ne sont pas considérées comme des valeurs aberrantes. Généralement, les moustaches s'étendent jusqu'à 1.5 fois l'IQR au-delà des quartiles.
  5. Identifier les valeurs aberrantes: Les valeurs qui se trouvent au-delà des moustaches sont considérées comme des valeurs aberrantes et sont représentées individuellement par des points.

Exemple: Supposons que nous ayons les âges de 10 participants à un atelier: 22, 25, 28, 30, 32, 35, 38, 40, 42, 55. Calculons les statistiques clés: minimum = 22, Q1 = 26.5, médiane = 33.5, Q3 = 40, maximum = 55. Nous pouvons ensuite construire une boîte à moustaches pour visualiser la distribution des âges.

Interprétation: Une boîte à moustaches permet d'évaluer rapidement:
  • La dispersion: La longueur de la boîte et des moustaches indique la dispersion des données.
  • La symétrie: Si la médiane est au centre de la boîte et les moustaches sont de longueur égale, la distribution est symétrique.
  • Les valeurs aberrantes: Les points situés en dehors des moustaches indiquent des valeurs aberrantes.

Choisir la Bonne Représentation Graphique

Le choix de la représentation graphique appropriée dépend du type de données et de l'objectif de l'analyse. Voici quelques indications:

  • Histogramme: Variable continue, visualisation de la distribution des fréquences.
  • Diagramme circulaire: Variable catégorielle, comparaison des proportions de différentes catégories.
  • Boîte à moustaches: Variable quantitative, résumé de la distribution et identification des valeurs aberrantes.

Ce qu'il faut retenir

  • Histogramme: Représente la distribution des fréquences d'une variable continue. Permet de visualiser la forme de la distribution.
  • Diagramme Circulaire: Représente les proportions de différentes catégories dans un ensemble de données. Utile pour comparer les parts relatives de chaque catégorie.
  • Boîte à Moustaches: Résume la distribution d'une variable quantitative à l'aide de cinq statistiques clés (minimum, Q1, médiane, Q3, maximum). Permet d'identifier la dispersion, la symétrie et les valeurs aberrantes.

FAQ

  • Quelle est la différence entre un histogramme et un diagramme en barres?

    Un histogramme représente la distribution de fréquences d'une variable continue, tandis qu'un diagramme en barres représente des données catégorielles. Dans un histogramme, les barres sont adjacentes (sans espace entre elles), tandis que dans un diagramme en barres, il y a un espace entre les barres.
  • Quand est-il préférable d'utiliser un diagramme circulaire plutôt qu'un diagramme en barres?

    Un diagramme circulaire est préférable lorsque vous souhaitez montrer la proportion de chaque catégorie par rapport au total. Un diagramme en barres est préférable lorsque vous souhaitez comparer les valeurs absolues de différentes catégories.
  • Comment identifier les valeurs aberrantes à partir d'une boîte à moustaches?

    Les valeurs aberrantes sont les points situés en dehors des moustaches de la boîte à moustaches. Elles représentent des valeurs qui sont significativement différentes des autres valeurs de l'ensemble de données.