Mathématiques > Probabilités et Statistiques > Statistiques > Paramètres de dispersion (étendue, variance, écart-type)
Paramètres de dispersion : Étendue, Variance et Écart-type
Comprendre et calculer l'étendue, la variance et l'écart-type. Découvrez comment ces mesures de dispersion permettent d'analyser la distribution des données et de mieux les interpréter.
Introduction aux paramètres de dispersion
Dans le domaine des statistiques, les paramètres de dispersion sont essentiels pour comprendre comment les données sont réparties autour de leur valeur centrale (comme la moyenne). Contrairement à la moyenne, qui nous donne une idée de la valeur typique, les paramètres de dispersion nous indiquent à quel point les données sont regroupées ou dispersées. Les trois principaux paramètres de dispersion que nous allons explorer sont l'étendue, la variance et l'écart-type.
L'étendue
L'étendue est la mesure de dispersion la plus simple. Elle est calculée en soustrayant la valeur la plus petite de la valeur la plus grande dans un ensemble de données.
Formule : Étendue = Valeur maximale - Valeur minimale
Exemple : Considérons l'ensemble de données suivant : 4, 6, 9, 3, 7. La valeur maximale est 9 et la valeur minimale est 3. Donc, l'étendue est 9 - 3 = 6.
Avantages : Facile à calculer et à comprendre.
Inconvénients : Très sensible aux valeurs extrêmes (outliers) et ne tient pas compte de la distribution des données entre les valeurs maximale et minimale.
La variance
La variance mesure la dispersion des données autour de la moyenne. Elle calcule la moyenne des carrés des écarts à la moyenne. Un écart est simplement la différence entre une donnée individuelle et la moyenne de l'ensemble de données.
Formule :
Variance (population) : σ² = Σ(xi - μ)² / N
Où:
Variance (échantillon) : s² = Σ(xi - x̄)² / (n - 1)
Où:
Étapes pour calculer la variance :
Exemple : Considérons l'ensemble de données suivant : 4, 6, 9, 3, 7.
Interprétation : Une variance élevée indique que les données sont très dispersées autour de la moyenne, tandis qu'une variance faible indique que les données sont regroupées autour de la moyenne.
Inconvénients : La variance est exprimée en unités au carré, ce qui peut rendre son interprétation difficile.
L'écart-type
L'écart-type est la racine carrée de la variance. Il mesure également la dispersion des données autour de la moyenne, mais il est exprimé dans la même unité que les données originales, ce qui le rend plus facile à interpréter.
Formule :
Écart-type (population) : σ = √σ² = √[Σ(xi - μ)² / N]
Écart-type (échantillon) : s = √s² = √[Σ(xi - x̄)² / (n - 1)]
Étapes pour calculer l'écart-type :
Exemple : En utilisant l'exemple précédent, la variance (échantillon) est de 5.7. Donc, l'écart-type (échantillon) est √5.7 ≈ 2.39.
Interprétation : Un écart-type élevé indique une plus grande dispersion des données autour de la moyenne, tandis qu'un écart-type faible indique un regroupement plus étroit des données autour de la moyenne.
Avantages : Facile à interpréter car il est exprimé dans la même unité que les données originales. Largement utilisé en statistique pour diverses analyses.
Importance du choix entre Variance Population et Variance Échantillon
Il est crucial de bien distinguer quand utiliser la variance de la population (σ²) et quand utiliser la variance de l'échantillon (s²).
Variance de la population (σ²) :
Variance de l'échantillon (s²) :
En résumé, si vous avez les données de toute la population, utilisez la variance de la population. Si vous n'avez qu'un échantillon, utilisez la variance de l'échantillon.
Exemple concret
Prenons l'exemple des notes d'un examen de mathématiques pour une classe de lycée. Supposons que nous ayons les notes suivantes (sur 20) : 10, 12, 14, 11, 13.
Calcul de l'étendue : La note maximale est 14, et la note minimale est 10. Donc l'étendue est 14 - 10 = 4.
Calcul de la variance (échantillon):
Calcul de l'écart-type (échantillon): L'écart-type est la racine carrée de la variance. Donc l'écart-type est √2.5 ≈ 1.58.
Interprétation : L'étendue de 4 nous indique que les notes varient sur un intervalle de 4 points. L'écart-type de 1.58 nous indique que les notes sont relativement regroupées autour de la moyenne de 12. Un écart-type plus grand indiquerait une plus grande dispersion des notes.
Ce qu'il faut retenir
FAQ
-
Quelle est la différence entre la variance et l'écart-type?
La variance est la moyenne des carrés des écarts à la moyenne, tandis que l'écart-type est la racine carrée de la variance. L'écart-type est plus facile à interpréter car il est exprimé dans la même unité que les données originales. -
Quand dois-je utiliser la formule de la variance pour une population et quand dois-je utiliser la formule pour un échantillon?
Vous devez utiliser la formule pour une population lorsque vous avez les données de toute la population. Vous devez utiliser la formule pour un échantillon lorsque vous travaillez avec un échantillon prélevé d'une population plus grande. -
Pourquoi divise-t-on par (n-1) et non par n lors du calcul de la variance d'un échantillon?
Diviser par (n-1), appelé degrés de liberté, fournit une estimation non biaisée de la variance de la population à partir de l'échantillon. Cela corrige une sous-estimation qui se produirait si l'on divisait simplement par n.