Corrélation bisériale de point
La corrélation bisériale de point est un cas particulier de corrélation de Pearson et examine la relation entre une variable dichotomique et une variable métrique.
Qu'est-ce qu'une variable dichotomique et qu'est-ce qu'une variable métrique ? Une variable dichotomique est une variable à deux expressions, par exemple le sexe (homme et femme) ou le statut tabagique (fumeur et non-fumeur). Une variable métrique est, par exemple, le poids ou le salaire d'une personne.
Ainsi, si nous avons une variable dichotomique et une variable métrique et que nous voulons savoir s'il existe une corrélation, nous pouvons utiliser une corrélation bisériale de point. Bien sûr, nous devons vérifier les conditions préalables, mais nous y reviendrons plus tard.
Calculer la corrélation bisériale de point
Comme nous l'avons dit au début, la corrélation bisériale de point est un cas particulier de la corrélation de Pearson. Mais comment calculer la corrélation de Pearson lorsqu'une variable est nominale ? Voyons cela à l'aide d'un exemple.
Supposons que nous voulions étudier la corrélation entre le nombre d'heures consacrées à l'apprentissage en vue d'un examen et le résultat de l'examen (réussite/échec).
Nous avons recueilli les données de 20 étudiants, dont 12 ont réussi l'examen et 8 ont échoué. Nous avons enregistré le nombre d'heures d'apprentissage de chaque étudiant pour l'examen.
Pour calculer la corrélation bisériale ponctuelle, nous devons d'abord convertir la note de l'examen en chiffres. Nous pouvons attribuer la valeur 1 aux étudiants qui ont réussi le test et la valeur 0 aux étudiants qui ont échoué.
Nous pouvons maintenant calculer la corrélation de Pearson entre le temps et la note obtenue à l'examen, ou utiliser l'équation de la corrélation bisériale de point.
Corrélation bisériale de point et corrélation de Pearson
Mais que nous calculions la corrélation de Pearson ou que nous utilisions l'équation de la corrélation bisériale de point, nous obtenons le même résultat dans les deux cas.
Jetons un coup d'œil rapide dans DATAtab. Nous avons les heures d'apprentissage, le résultat du test avec réussite et échec, et le résultat du test avec zéro et un. Le résultat du test avec zéro et un est défini comme une métrique.
Si nous passons maintenant à la corrélation et calculons la corrélation de Pearson pour ces deux variables, nous obtenons un coefficient de corrélation de 0,31. Si nous calculons la corrélation bisériale de point pour les heures d'apprentissage et le résultat de l'examen avec "réussi" et "échoué", nous obtenons également une corrélation de 0,31.
Coefficient de corrélation bisériale de point
Tout comme le coefficient de corrélation de Pearson r, le coefficient de corrélation bisériale de point rpb varie également entre -1 et 1.
Si nous avons un coefficient compris entre -1 et inférieur à 0, il y a une corrélation négative, c'est-à-dire une relation négative entre les variables.
Si le coefficient est compris entre plus de 0 et 1, il s'agit d'une corrélation positive, c'est-à-dire une relation positive entre les deux variables.
Si le résultat égale 0, il n'y a pas de corrélation.
Hypothèses
Souvent, cependant, à partir d'un échantillon, on veut tester une hypothèse sur la population. Dans le cas de l'analyse de corrélation, nous pouvons tester si le coefficient de corrélation est significativement différent de 0.
Les hypothèses de la corrélation bisériale de point sont donc les suivantes :
- Hypothèse nulle : le coefficient de corrélation r = 0 (il n'y a pas de corrélation)
- Hypothèse alternative : le coefficient de corrélation r ≠ 0 (il existe une corrélation).
Corrélation bisériale de point et test t pour échantillons indépendants
Lorsque nous calculons une corrélation ponctuelle, nous obtenons la même valeur p que lorsque nous calculons un test t pour échantillons indépendants sur les mêmes données.
Ainsi, que l'on teste une hypothèse de corrélation avec la corrélation bisériale de point ou une hypothèse de différence avec le test t, on obtient la même valeur p.
Si nous calculons un test t dans Datatab avec les données sous l'onglet "Tests d'hypothèses", et que nous avons l'hypothèse nulle : "Il n'y a pas de différence entre les groupes non admis et admis en ce qui concerne la variable heures d'apprentissage", nous obtenons une valeur p de 0,179.
De même, si nous calculons une corrélation bisériale de point sous l'onglet "Corrélation" et que nous avons l'hypothèse nulle : "Il n'y a pas de corrélation entre les heures d'apprentissage et le score à l'examen", nous obtenons également une valeur p de 0,179 !
Dans notre exemple, la valeur p est supérieure à 0,05, seuil le plus souvent utilisé comme niveau de signification, et l'hypothèse nulle n'est donc pas rejetée.
Conditions d'application d'une corrélation bisériale de point
En ce qui concerne les conditions de la corrélation bisériale de point, nous devons distinguer si nous voulons calculer uniquement le coefficient de corrélation ou si nous voulons tester une hypothèse. Pour calculer le coefficient de corrélation, il suffit d'avoir une variable métrique et une variable dichotomique.
Cependant, si nous voulons tester si le coefficient de corrélation est significativement différent de zéro, la variable métrique doit également être normalement distribuée ! Dans le cas contraire, la statistique de test t ou la valeur p ne peuvent pas être interprétées de manière fiable !