Indicateurs de dispersion
L'écart-type, la variance et l'étendue font partie des mesures de dispersion (mesure de la variabilité) en statistique descriptive. Elles sont calculées pour décrire la dispersion des valeurs d'un échantillon autour d'un indicateur de position. En termes simples, les paramètres de dispersion sont une mesure de l'ampleur des fluctuations d'un échantillon autour d'une valeur moyenne.
La mesure de la tendance centrale vous donne des informations sur le centre de vos données, tandis que les mesures de dispersion vous donnent des informations sur la dispersion de vos données autour de ce centre.
Écart-type et variance
Les mesures de dispersion les plus courantes pour les variables métriques sont l'écart-type et la variance. Ces deux mesures relient chaque caractéristique d'une variable à la valeur moyenne et indiquent ainsi dans quelle mesure les caractéristiques individuelles sont dispersées autour de la valeur moyenne.
Qu'est-ce que l'écart-type ?
L'écart-type indique la dispersion d'une variable autour de sa valeur moyenne. Ainsi, l'écart-type est la déviation moyenne (moyenne quadratique) de toutes les valeurs mesurées par rapport à la moyenne.
L'écart-type indique par conséquent dans quelle mesure la distribution des valeurs s'écarte de la valeur moyenne. Si les valeurs individuelles sont fortement dispersées autour de la valeur moyenne, l'écart-type de la variable est important. Il existe deux équations légèrement différentes pour ce calcul. D'une part, la population entière peut être utilisée pour calculer l'écart-type. D'autre part, il peut également être calculé si un seul échantillon est disponible. Si toutes les valeurs de la population sont disponibles, on obtient les résultats suivants :
Souvent, cependant, les données de la population entière ne sont pas disponibles. Par conséquent, un échantillon est généralement utilisé pour estimer l'écart-type de la population. Dans ce cas, le calcul donne les résultats suivants :
La différence entre les deux formules est que l'une est divisée par n et l'autre par n-1. Il est d'usage d'utiliser s pour l'écart-type d'un échantillon et σ pour l'écart-type de la population.
Qu'est-ce que la variance ?
Tout comme l'écart-type, la variance mesure l'écart par rapport à la moyenne. Pour le calcul de la variance, la somme des carrés des écarts est divisée par le nombre de valeurs.
La variance décrit donc l'écart moyen au carré par rapport à la moyenne. Comme les valeurs sont élevées au carré, le résultat a une unité différente (l'unité au carré) de celle des valeurs originales. Il est donc difficile de mettre les résultats en relation.
Variance par rapport à l'écart-type
La différence entre la variance et l'écart-type comme indicateur de dispersion est donc que l'écart-type mesure la distance moyenne par rapport à la moyenne et que la variance mesure la distance moyenne au carré par rapport à la moyenne. En d'autres termes, la variance est le carré de l'écart-type et l'écart-type est la racine carrée de la variance.
Cependant, cette mise au carré donne lieu à un ratio difficile à interpréter, car l'unité ne correspond pas aux données d'origine. Pour cette raison, il est conseillé de toujours utiliser l'écart-type pour décrire un échantillon, car cela facilite l'interprétation.
Étendue
L'étendue, également appelée span, est la distance entre le minimum et le maximum d'une distribution, c'est-à-dire la distance entre la plus petite et la plus grande valeur. Par exemple, si l'on interroge la taille de 7 personnes et que la plus grande valeur est 1,90 m et la plus petite 1,50 m, l'étendue est calculée comme suit : 1,90 m - 1,50 m égal à 0,4 m.
Définition de la portée :
L'étendue indique la distance entre la valeur la plus élevée et la valeur la plus faible d'un échantillon.
L'étendue, souvent abrégée par R, est donc calculée comme suit :
Quartile
Les quartiles divisent vos données en quatre parties, aussi égales que possible. Pour le calcul des quartiles, les données doivent être triées de la plus petite à la plus grande valeur.
- Quartile (Q1) : la valeur intermédiaire entre la plus petite valeur (minimum) et la médiane.
- Quartile (Q2) : la médiane des données, c'est-à-dire que 50% des valeurs sont plus petites et 50% des valeurs sont plus grandes.
- Quartile (Q3) : la valeur intermédiaire entre la médiane et la plus grande valeur (maximum).
Ainsi, 25% de toutes les valeurs se trouvent dans le quartile inférieur Q1 et 25% de toutes les valeurs se trouvent dans le quartile supérieur Q3.
Écart interquartile
Contrairement à l'intervalle dans lequel se trouvent 100 % de toutes les valeurs, on souhaite souvent connaître l'intervalle dans lequel se trouvent les 50 % de valeurs intermédiaires. Cet indicateur de dispersion est appelé écart interquartile. Les 25% supérieurs et inférieurs des valeurs ne sont donc pas pris en compte pour l'écart interquartile.
Exemple d'indicateurs de dispersion
Le calcul de l'étendue, de la variance et de l'écart-type peut être illustré par un exemple. Pour ce faire, nous utiliserons les résultats des étudiants à un examen de statistiques (notes).
Étudiant | Score |
---|---|
1 | 4 |
2 | 5 |
3 | 5 |
4 | 8 |
5 | 9 |
6 | 12 |
7 | 14 |
8 | 16 |
9 | 17 |
10 | 20 |
Voici comment cela fonctionne sur DATAtab : la calculatrice de statistiques descriptives sur DATAtab vous donnera l'étendue, la variance et l'écart type. Copiez les données ci-dessus dans la calculatrice de statistiques en ligne, cliquez sur Statistiques descriptives et sélectionnez la variable Score. Le résultat ressemblera à ceci :
Score | |
---|---|
Écart type | 5.637 |
Variance | 31.778 |
Fourchette | 16 |
Calculer la variance :
La variance est la somme des écarts au carré par rapport à la valeur moyenne de toutes les valeurs, divisée par le nombre de valeurs.
Calculer l'écart-type :
L'écart-type est la racine carrée de la variance.
Calculer l'étendue :
L'étendue est obtenue en soustrayant la plus petite valeur de la plus grande.