Corrélation bisériale de point

Télécharger un échantillon de données

La corrélation bisériale de point est un cas particulier de corrélation de Pearson et examine la relation entre une variable dichotomique et une variable métrique.

Qu'est-ce qu'une variable dichotomique et qu'est-ce qu'une variable métrique ? Une variable dichotomique est une variable à deux expressions, par exemple le sexe (homme et femme) ou le statut tabagique (fumeur et non-fumeur). Une variable métrique est, par exemple, le poids ou le salaire d'une personne.

Ainsi, si nous avons une variable dichotomique et une variable métrique et que nous voulons savoir s'il existe une corrélation, nous pouvons utiliser une corrélation bisériale de point. Bien sûr, nous devons vérifier les conditions préalables, mais nous y reviendrons plus tard.

Calculer la corrélation bisériale de point

Comme nous l'avons dit au début, la corrélation bisériale de point est un cas particulier de la corrélation de Pearson. Mais comment calculer la corrélation de Pearson lorsqu'une variable est nominale ? Voyons cela à l'aide d'un exemple.

Supposons que nous voulions étudier la corrélation entre le nombre d'heures consacrées à l'apprentissage en vue d'un examen et le résultat de l'examen (réussite/échec).

Exemple de corrélation bisériale ponctuelle

Nous avons recueilli les données de 20 étudiants, dont 12 ont réussi l'examen et 8 ont échoué. Nous avons enregistré le nombre d'heures d'apprentissage de chaque étudiant pour l'examen.

Pour calculer la corrélation bisériale ponctuelle, nous devons d'abord convertir la note de l'examen en chiffres. Nous pouvons attribuer la valeur 1 aux étudiants qui ont réussi le test et la valeur 0 aux étudiants qui ont échoué.

Échantillon de données pour une corrélation bisériale ponctuelle

Nous pouvons maintenant calculer la corrélation de Pearson entre le temps et la note obtenue à l'examen, ou utiliser l'équation de la corrélation bisériale de point.

Équation de la corrélation bisériale ponctuelle

Corrélation bisériale de point et corrélation de Pearson

Mais que nous calculions la corrélation de Pearson ou que nous utilisions l'équation de la corrélation bisériale de point, nous obtenons le même résultat dans les deux cas.

Télécharger un échantillon de données

Jetons un coup d'œil rapide dans DATAtab. Nous avons les heures d'apprentissage, le résultat du test avec réussite et échec, et le résultat du test avec zéro et un. Le résultat du test avec zéro et un est défini comme une métrique.

Calculer la corrélation bisériale de point

Si nous passons maintenant à la corrélation et calculons la corrélation de Pearson pour ces deux variables, nous obtenons un coefficient de corrélation de 0,31. Si nous calculons la corrélation bisériale de point pour les heures d'apprentissage et le résultat de l'examen avec "réussi" et "échoué", nous obtenons également une corrélation de 0,31.

Corrélation bisériale de point et corrélation de Pearson

Coefficient de corrélation bisériale de point

Tout comme le coefficient de corrélation de Pearson r, le coefficient de corrélation bisériale de point r_pb varie également entre -1 et 1.

Si nous avons un coefficient compris entre -1 et inférieur à 0, il y a une corrélation négative, c'est-à-dire une relation négative entre les variables.

Si le coefficient est compris entre plus de 0 et 1, il s'agit d'une corrélation positive, c'est-à-dire une relation positive entre les deux variables.

Si le résultat égale 0, il n'y a pas de corrélation.

Hypothèses

Souvent, cependant, à partir d'un échantillon, on veut tester une hypothèse sur la population. Dans le cas de l'analyse de corrélation, nous pouvons tester si le coefficient de corrélation est significativement différent de 0.

Les hypothèses de la corrélation bisériale de point sont donc les suivantes :

Hypothèse nulle : le coefficient de corrélation r = 0 (il n'y a pas de corrélation)
Hypothèse alternative : le coefficient de corrélation r ≠ 0 (il existe une corrélation).

Corrélation bisériale de point et test t pour échantillons indépendants

Lorsque nous calculons une corrélation ponctuelle, nous obtenons la même valeur p que lorsque nous calculons un test t pour échantillons indépendants sur les mêmes données.

Ainsi, que l'on teste une hypothèse de corrélation avec la corrélation bisériale de point ou une hypothèse de différence avec le test t, on obtient la même valeur p.

Télécharger les données de l'échantillon

Si nous calculons un test t dans Datatab avec les données sous l'onglet "Tests d'hypothèses", et que nous avons l'hypothèse nulle : "Il n'y a pas de différence entre les groupes non admis et admis en ce qui concerne la variable heures d'apprentissage", nous obtenons une valeur p de 0,179.

Corrélation bisériale ponctuelle et test t sur échantillons indépendants

De même, si nous calculons une corrélation bisériale de point sous l'onglet "Corrélation" et que nous avons l'hypothèse nulle : "Il n'y a pas de corrélation entre les heures d'apprentissage et le score à l'examen", nous obtenons également une valeur p de 0,179 !

Dans notre exemple, la valeur p est supérieure à 0,05, seuil le plus souvent utilisé comme niveau de signification, et l'hypothèse nulle n'est donc pas rejetée.

Conditions d'application d'une corrélation bisériale de point

En ce qui concerne les conditions de la corrélation bisériale de point, nous devons distinguer si nous voulons calculer uniquement le coefficient de corrélation ou si nous voulons tester une hypothèse. Pour calculer le coefficient de corrélation, il suffit d'avoir une variable métrique et une variable dichotomique.

Cependant, si nous voulons tester si le coefficient de corrélation est significativement différent de zéro, la variable métrique doit également être normalement distribuée ! Dans le cas contraire, la statistique de test t ou la valeur p ne peuvent pas être interprétées de manière fiable !