Menu

ANOVA à deux facteurs (sans répétition)

Qu'est-ce qu'une ANOVA à deux facteurs ?

L'analyse de variance à deux facteurs (ou two-way) permet de vérifier s'il existe une différence entre plus de deux échantillons indépendants répartis entre deux variables ou facteurs.

Analyse de la variance à deux facteurs sans répétition

Qu'est-ce qu'un facteur ?

Un facteur est, par exemple, le sexe d'une personne avec les caractéristiques homme et femme, la forme de thérapie utilisée pour une maladie avec la thérapie A, B et C ou le domaine d'études avec, par exemple, la médecine, la gestion d'entreprise, la psychologie et les mathématiques.

Qu'est-ce qu'un facteur ?

Dans le cas de l'analyse de la variance, un facteur est une variable catégorielle. L'analyse de la variance est utilisée chaque fois que l'on souhaite vérifier si ces catégories ont une influence sur ce que l'on appelle la variable dépendante.

On peut par exemple vérifier si le sexe a une influence sur le salaire, si la thérapie a une influence sur la tension artérielle ou si le domaine d'études a une influence sur la durée des études. Le salaire, la tension artérielle et la durée des études sont alors les variables dépendantes. Dans tous ces cas, on vérifie si le facteur a une influence sur la variable dépendante.

Comme il n'y a qu'un seul facteur dans ces cas, on utilisera une analyse de variance à un seul facteur (sauf bien sûr pour le sexe, où nous avons une variable avec seulement deux expressions, et où nous utiliserons le test t pour les échantillons indépendants).

Deux facteurs

Il se peut que l'on ait maintenant une autre variable catégorielle que l'on souhaite également inclure. Il peut être intéressant de savoir si :

  • outre le sexe, le niveau d'études le plus élevé a également une influence sur le salaire.
  • outre la thérapie, le sexe a également une influence sur la tension artérielle.
  • outre le domaine d'études, l'université fréquentée a également une influence sur la durée des études.
ANOVA à un facteur vs ANOVA à deux facteurs

Dans les trois cas, il n'y a pas un seul facteur, mais deux facteurs pour chacun d'entre eux. C'est pourquoi on utilise l'analyse de variance à deux facteurs.

L'analyse de la variance à deux facteurs permet de répondre à trois questions :

  • Le facteur 1 a-t-il un effet sur la variable dépendante ?
  • Le facteur 2 a-t-il un effet sur la variable dépendante ?
  • Existe-t-il une interaction entre le facteur 1 et le facteur 2 ?

Par conséquent, dans le cas d'une analyse de variance à un facteur, nous disposons d'un facteur à partir duquel nous créons les groupes. Dans le cas de l'analyse de variance à deux facteurs, les groupes résultent de la combinaison des expressions des deux facteurs.

Un facteur vs. deux facteurs

Hypothèses

Trois affirmations peuvent être testées avec l'ANOVA à 2 facteurs, il y a donc 3 hypothèses nulles et 3 hypothèses alternatives.

Hypothèses nulles H0 Hypothèses alternatives H1
Il n'y a pas de différences significatives dans la moyenne entre les groupes (niveaux de facteurs) du premier facteur. Il y a une différence significative dans la moyenne entre les groupes (niveaux de facteurs) du premier facteur.
Il n'y a pas de différences significatives dans la moyenne entre les groupes (niveaux des facteurs) du deuxième facteur. Il y a une différence significative dans la moyenne entre les groupes (niveaux des facteurs) du deuxième facteur.
Les facteurs n'interagissent pas entre eux. Les facteurs interagissent entre eux.

Conditions préalables

Pour qu'une analyse de variance à deux facteurs puisse être calculée sans répétition de mesures, les conditions suivantes doivent être satisfaites :

  • Le niveau d'échelle de la variable dépendante doit être métrique, celui de la variable indépendante (le facteur) nominal.
  • Indépendance : les mesures doivent être indépendantes, c'est-à-dire faites sur des groupes de sujets différents de telle sorte que la valeur mesurée d'un groupe ne doit pas être influencée par la valeur mesurée d'un autre groupe. Si tel était le cas, nous aurions besoin d'une analyse de variance sur mesures répétées (autrement dit sur des groupes de sujets identiques).
  • Homogénéité : les variances dans chaque groupe doivent être approximativement égales. Ceci peut être vérifié par le test de Levene.
  • Distribution normale : les données au sein des groupes doivent être normalement distribuées.

La variable dépendante peut donc être, par exemple, le salaire, la tension artérielle et la durée des études. Ce sont toutes des variables métriques. La variable indépendante doit être nominalement ou ordinalement échelonnée. Par exemple, le sexe, le niveau d'études le plus élevé ou un type de thérapie. Il convient toutefois de noter que l'ordre de classement n'est pas utilisé avec les variables ordinales, de sorte que cette information est perdue.

Calculer une ANOVA à deux facteurs

Pour calculer une ANOVA à deux facteurs, les formules suivantes sont nécessaires. Voyons cela à l'aide d'un exemple.

Formules de calcul d'une ANOVA à deux facteurs

Imaginons que vous travaillez dans le département marketing d'une banque et que vous vouliez déterminer si le sexe et le fait d'avoir étudié ou non ont une influence sur l'attitude d'une personne à l'égard de la planification de la retraite.

Dans cet exemple, les deux variables indépendantes (facteurs) sont le sexe (homme ou femme) et les études (oui ou non). La variable dépendante est l'attitude à l'égard de la planification de la retraite, où 1 signifie "pas important" et 10 "très important".

Exemple de données pour une ANOVA à deux facteurs

Cependant, l'attitude à l'égard de la planification de la retraite est-elle vraiment une variable métrique ? Supposons simplement que l'attitude à l'égard de la planification de la retraite a été mesurée à l'aide d'une échelle de Likert et que nous considérons donc la variable résultante comme métrique.

Valeurs moyennes

Dans un premier temps, nous calculons les valeurs moyennes des groupes individuels, c'est-à-dire des hommes qui n'ont pas étudié, soit 5,8, puis des hommes qui ont étudié, soit 5,4, et nous faisons de même pour les femmes.

Nous calculons ensuite la moyenne de tous les hommes et de toutes les femmes, ainsi que de ceux qui n'ont pas étudié et de ceux qui ont étudié, respectivement. Enfin, nous calculons la moyenne globale, qui est de 5,4.

Sommes des carrés

Nous pouvons maintenant calculer les sommes des carrés nécessaires. SStot est la somme des carrés de chaque valeur individuelle moins la moyenne générale.

Somme des carrés pour une ANOVA à deux facteurs

SSbtw résulte de la somme des carrés des moyennes des groupes moins la moyenne générale multipliée par le nombre de valeurs dans les groupes.

Les sommes des carrés des facteurs SSA et SSB résultent de la somme des carrés des moyennes des niveaux des facteurs moins la moyenne totale.

Nous pouvons maintenant calculer la somme des carrés de l'interaction. Elle est obtenue en calculant SSbtw moins SSA moins SSB.

Enfin, nous calculons la somme des carrés pour l'erreur. Le calcul est similaire à celui de la somme totale des carrés, c'est pourquoi nous utilisons à nouveau chaque valeur individuelle. Seulement, dans ce cas, au lieu de soustraire la moyenne globale de chaque valeur, nous soustrayons la moyenne du groupe respectif de chaque valeur.

Degrés de liberté

Les degrés de liberté requis sont les suivants :

Degrés de liberté dans une ANOVA à deux facteurs

Moyenne des carrés ou variance (Carrés moyen)

Avec les sommes des carrés et les degrés de liberté, la variance peut maintenant être calculée :

Variance - ANOVA à deux facteurs

Valeur F

Nous pouvons maintenant calculer les valeurs F. Celles-ci sont obtenues en divisant la variance du facteur A, du facteur B ou de l'interaction AB par la variance de l'erreur.

Valeur F - ANOVA à deux facteurs

Valeur p

Pour calculer la valeur p, nous avons besoin de la valeur F, des degrés de liberté et de la distribution F. Nous utilisons le calculateur de valeur p et de la distribution F sur DATAtab. Bien sûr, il est également possible de calculer entièrement l'exemple avec DATAtab. Vous trouverez plus d'informations à ce sujet dans la section suivante.

La valeur p et la valeur F critique dans une ANOVA à deux facteurs

Cela nous donne une valeur p de 0,323 pour le facteur A, une valeur p de 0,686 pour le facteur B et une valeur p de 0,55 pour l'interaction. Aucune de ces valeurs p n'est inférieure à 0,05 et nous conservons donc les hypothèses nulles respectives.

Calcul de l'ANOVA à deux facteurs avec DATAtab

Calculer l'exemple directement avec DATAtab gratuitement :

Charger l'ensemble de données ANOVA

Reprenons l'exemple précédent. Les données sont maintenant organisées de manière à ce que le logiciel de statistiques puisse en faire quelque chose. Chaque ligne contient un répondant.

Attitude à l'égard de la planification de la retraite Étudié Sexe
6 non homme
4 non homme
5 non femme
... ... ...
5 oui femme
9 oui femmes
2 oui femme
3 oui femme

Cet exemple ne comporte que 20 cas, ce qui n'est évidemment pas beaucoup et nous donne une puissance de test très faible, mais il devrait convenir en tant qu'exemple.

Pour calculer une analyse de variance à deux facteurs en ligne, il suffit de se rendre sur datatab.com et de copier ses propres données dans ce tableau.

Cliquez ensuite sur "Test d'hypothèse". Sous cet onglet, vous trouverez de nombreux tests d'hypothèse et, en fonction de la variable sur laquelle vous cliquez, un test d'hypothèse approprié vous sera suggéré.

Calculer une ANOVA à deux facteurs avec DATAtab

Lorsque vous copiez vos données dans le tableau, les variables apparaissent sous le tableau. Si le niveau d'échelle correct n'est pas automatiquement détecté, vous pouvez simplement le modifier sous Vue des variables.

Nous voulons savoir si le sexe et le fait d'avoir étudié ou non ont un impact sur l'attitude à l'égard de la planification de la retraite. Il suffit donc de cliquer sur les trois variables.

DATAtab calcule automatiquement une analyse de variance à deux facteurs sans mesures répétées. DATAtab produit les trois hypothèses nulles et les trois hypothèses alternatives, puis les statistiques descriptives et le test de Levene d'égalité de la variance. Le test de Levene permet de vérifier si les variances au sein des groupes sont égales. La valeur p étant supérieure à 0,05, nous supposons l'égalité de la variance au sein des groupes pour ces données.

Résultats de l'ANOVA à deux facteurs

Viennent ensuite les résultats de l'ANOVA à deux facteurs.

Interprétation de l'ANOVA à deux facteurs

Interprétation de l'ANOVA à deux facteurs

Le plus important dans ce tableau, ce sont les trois lignes étiquetées. Grâce à ces trois lignes, vous pouvez tester si les trois hypothèses nulles que nous avons formulées précédemment sont maintenues ou rejetées.

La première ligne teste l'hypothèse nulle, à savoir si le fait d'avoir étudié ou non a un effet sur l'attitude à l'égard de la planification de la retraite, la deuxième ligne teste si le sexe a un effet sur l'attitude et la troisième ligne teste l'interaction entre le fait d'avoir étudié et le sexe.

La valeur p est indiquée dans chaque cas à la fin du document. Disons que nous avons fixé le seuil de signification à 5 %. Si la valeur p calculée est inférieure à 0,05, l'hypothèse nulle est rejetée, et si la valeur p calculée est supérieure à 0,05, l'hypothèse nulle est retenue.

Ainsi, dans ce cas, nous constatons que les trois valeurs p sont supérieures à 0,05 et que nous ne pouvons donc rejeter aucune des trois hypothèses nulles.

Par conséquent, ni le fait d'avoir étudié ou non, ni le sexe n'ont d'effet significatif sur les attitudes à l'égard de la planification de la retraite. Il n'y a pas non plus d'interaction significative entre le fait d'avoir étudié et le sexe en ce qui concerne les attitudes à l'égard de la planification de la retraite.

Si vous ne savez pas exactement comment interpréter les résultats, vous pouvez aussi cliquer sur Résumé en mots. Il est possible ici de vérifier si les hypothèses de l'analyse de variance sont respectées.

Effet d'interaction

Mais que signifie exactement l'interaction ? Jetons d'abord un coup d'œil à ce diagramme.

Interaction

La variable dépendante est représentée sur l'axe vertical des y (les ordonnées), dans notre exemple l'attitude à l'égard de la prévoyance vieillesse. Sur l'axe horizontal des x (les abscisses), l'un des deux facteurs est représenté, par exemple le sexe. L'autre facteur est représenté par des lignes de différentes couleurs. Le vert représente "a étudié" et le rouge "n'a pas fait d'études".

Les extrémités des lignes sont les valeurs moyennes des groupes, par exemple homme et non étudié.

Dans ce diagramme, on peut voir que le sexe et la variable "avoir étudié ou non" ont une influence sur les attitudes à l'égard de la planification de la retraite. Les femmes ont une valeur plus élevée que les hommes et les personnes ayant étudié ont une valeur plus élevée que les personnes n'ayant pas étudié.

Mais passons enfin aux effets d'interaction, pour lesquels nous comparons ces deux graphiques.

Effet d'interaction

Dans le premier cas, nous avons dit qu'il n'y avait pas d'effet d'interaction. Si une personne a étudié, elle a une valeur qui est, disons, 1,5 plus élevée qu'une personne qui n'a pas étudié.

Cette augmentation de 1,5 est indépendante du fait que la personne soit un homme ou une femme.

Il en va différemment dans le cas présent : les personnes qui ont étudié ont également une valeur plus élevée, mais cette valeur est plus ou moins élevée selon qu'il s'agit d'un homme ou d'une femme. Si je suis un homme, il y a une différence de, disons par exemple, 0,5 et si je suis une femme, il y a une différence de 3,5.

Dans ce cas, nous avons donc clairement une interaction entre le sexe et les études, car les deux variables s'influencent mutuellement. L'influence des études est différente selon que je suis un homme ou une femme.

Dans ce cas, nous avons un effet d'interaction, mais la direction reste la même. Les femmes ont donc des scores plus élevés que les hommes et ceux qui ont fait des études ont des scores plus élevés que ceux qui n'en ont pas faits.

Cité DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.net

Contact FAQ et à propos de nous Politique de confidentialité Logiciel de statistiques