Boîte à moustaches
Qu'est-ce qu'un diagramme en boîte (boxplot) ? Avec un diagramme en boîte, vous pouvez afficher graphiquement un grand nombre d'informations sur vos données. La médiane, l'intervalle interquartile et les valeurs aberrantes peuvent notamment être lus dans un diagramme en boîte.
Les données utilisées sont le plus souvent à l'échelle métrique, comme l'âge d'une personne, la consommation annuelle d'électricité ou la température.
Un boxplot est souvent créé pour comparer et contraster deux ou plusieurs groupes. Par exemple, l'âge de différents groupes.
Comment interpréter un diagramme en boîte ?
La boîte elle-même indique la plage dans laquelle se situent les 50 % intermédiaires de toutes les valeurs. Ainsi, l'extrémité inférieure de la boîte correspond au 1er quartile et l'extrémité supérieure correspond au 3e quartile.
Par conséquent, 25 % des données se trouvent en dessous de q1 et 25 % des données se trouvent au-dessus de q3, 50 % de vos données se trouvent dans la boîte elle-même.
Supposons que nous examinions l'âge des individus dans un boxplot, et que q1 égale 31 ans, alors cela signifie que 25% des participants ont moins de 31 ans. Si q3 égale 63 ans, cela signifie que 25% des participants ont plus de 63 ans, 50% des participants ont donc entre 31 et 63 ans. Ainsi, entre q1 et q3 se trouve l'écart interquartile.
Dans le boxplot, la ligne pleine indique la médiane et la ligne pointillée indique la moyenne.
Par exemple, si la médiane égale 42, cela signifie que la moitié des participants ont moins de 42 ans et l'autre moitié plus de 42 ans. La médiane divise donc les individus en deux groupes égaux.
Les moustaches en forme de T vont jusqu'au dernier point, qui se situe toujours à l'intérieur de 1,5 fois l'écart interquartile. Qu'est-ce que cela signifie ? La moustache en forme de T correspond soit à la valeur maximale de vos données, mais au maximum à 1,5 fois l'écart interquartile. Par conséquent, si vous avez une valeur aberrante, la moustache va jusqu'à 1,5 fois l'écart interquartile. S'il n'y a pas de valeur aberrante, la moustache correspond à la valeur maximale.
La moustache supérieure correspond donc soit à la valeur maximale, soit à 1,5 fois l'écart interquartile. Il en va de même pour la moustache inférieure, qui correspond soit à la valeur minimale, soit à 1,5 fois l'écart interquartile.
Les points qui sont plus éloignés sont considérés comme des valeurs aberrantes. Si aucun point n'est plus éloigné que 1,5 fois l'écart interquartile, la moustache en forme de T indique la valeur maximale ou minimale.
Créer un boxplot en ligne
Sur DATAtab, vous pouvez facilement créer un boxplot en ligne. Pour ce faire, cliquez sur la calculatrice de statistiques, copiez vos propres données dans le tableau, sélectionnez l'onglet "Descriptive" ou "Charts" et cliquez sur les variables pour lesquelles vous voulez créer un boxplot.
Dans le boxplot supérieur créé avec DATAtab online, la localisation des chutes dans un hôpital a été mise en contraste avec l'âge des personnes qui sont tombées.