Menu

Test t par paire

Qu'est-ce que le test t pour les échantillons dépendants ?

Le Test t par paire (test t pour échantillons appariés) est un test statistique qui détermine s'il existe une différence entre deux groupes ou échantillons dépendants.

Le test t pour échantillons appariés, également connu sous le nom de test t pour échantillons dépendants, vérifie si les valeurs moyennes de deux groupes dépendants diffèrent significativement l'une de l'autre.

Test t par paire

Pourquoi a-t-on besoin du test t pour échantillons appariés ?

Le test t pour échantillons appariés est nécessaire chaque fois qu'une enquête est menée auprès d'un même groupe ou d'un même échantillon à deux moments différents. Par exemple, on peut chercher à savoir si un programme de réadaptation a un effet positif sur la condition physique. Comme il n'est pas possible d'interroger toutes les personnes qui suivent un programme de rééducation, on utilise un échantillon aléatoire. On peut ensuite utiliser le test t par paires pour déduire la population à partir de l'échantillon.

Test t pour échantillons appariés

Qu'est-ce qu'un échantillon dépendant ou apparié ?

Dans les échantillons dépendants, les valeurs mesurées sont disponibles par paires. Les paires résultent de mesures répétées, de la parallélisation ou de l'appariement. Cela peut être le cas, par exemple, dans les études longitudinales comportant plusieurs points de mesure (analyses de séries chronologiques) ou dans les études d'intervention comportant des plans expérimentaux (mesures avant-après).

Un exemple d'échantillonnage dépendant est la mesure du poids d'un groupe de personnes à deux moments donnés. Une personne peut alors se voir attribuer un poids unique au premier et au deuxième moment de mesure et la différence entre les valeurs mesurées peut être calculée dans chaque cas. Si l'on dispose de plus de deux temps de mesure, on utilise l'ANOVA avec mesures répétées.

Quel est l'avantage d'un test t dépendant par rapport à un test t indépendant ?

La question de savoir s'il faut utiliser un test t dépendant ou un test t indépendant est, bien entendu, déjà déterminée dans le cadre de la conception de l'étude, et il n'est pas possible d'utiliser arbitrairement l'un ou l'autre test. La question est donc plutôt de savoir quel type d'étude est le plus logique :

  • Réaliser une étude avec un groupe de participants qui sont mesurés deux fois.
  • Réaliser une étude avec deux groupes distincts de participants, chacun mesuré une fois.

Le principal avantage d'un plan à mesures répétées qui utilise ensuite le test t dépendant est que les différences individuelles entre les participants peuvent être éliminées. Cela signifie que la probabilité de détecter une différence (statistiquement significative), si elle existe, est plus élevée avec le test t dépendant qu'avec le test t indépendant.

Test t dependant vs test t independant

Exemple de test t pour échantillons appariés

Le test t pour les échantillons dépendants a de nombreuses applications, dont voici trois exemples.

Exemple médical :

On veut vérifier si un nouveau médicament augmente les performances de la mémoire. On teste les performances de mémoire de 40 personnes avant et après la prise du médicament.

Exemple technique :

Une usine de vis se plaint de temps d'arrêt très élevés dans ses cinq usines de production. Il s'agit de déterminer si un nouveau lubrifiant a une influence sur les temps d'arrêt. Pour ce faire, vous devez comparer les temps d'arrêt des 5 usines avant et après l'introduction du nouveau lubrifiant.

Exemple en sciences sociales :

On veut savoir s'il y a eu un changement entre 2010 et 2015 en ce qui concerne la prise de conscience de la population allemande en matière de santé. Pour ce faire, on peut par exemple s'appuyer sur les données du panel socio-économique (SOEP). Le SOEP est une enquête représentative répétée auprès des ménages privés en Allemagne. L'enquête interroge toujours les mêmes personnes à intervalles réguliers sur les mêmes sujets. Pour répondre à votre question, vous comparerez la conscience des personnes en matière de santé en 2010 et en 2015.

Question de recherche et hypothèses

Pour pouvoir calculer un test t pour des échantillons dépendants, il faut d'abord définir une question et des hypothèses.

Question de recherche

Dans un test t pour échantillons dépendants, la question générale est la suivante : existe-t-il une différence statistiquement significative entre la valeur moyenne de deux groupes dépendants ?

Les questions pour les exemples ci-dessus se posent comme suit :

  • Le nouveau médicament contribue-t-il à améliorer les performances de la mémoire ?
  • Le nouveau lubrifiant a-t-il une influence sur les temps d'arrêt ?
  • La conscience en matière de santé de la population allemande a-t-elle changé entre 2010 et 2015 ?

Hypothèses

L'hypothèse peut maintenant être dérivée de la question. Dans l'hypothèse, une supposition préliminaire, c'est-à-dire non corroborée, est faite et doit être testée. Dans le cas d'un test t pour des échantillons dépendants, il s'agit des hypothèses suivantes :

  • Hypothèse nulle H0: la valeur moyenne des deux groupes dépendants est égale.
  • Hypothèse alternative H1: les valeurs moyennes des deux groupes dépendants sont différentes.

Hypothèses t-Test en binôme

Bien entendu, les conditions préalables doivent être vérifiées avant de calculer le test t dépendant. Si les conditions 2 et 3 ne sont pas remplies, le test de Wilcoxon doit être utilisé. Le test de Wilcoxon est le pendant non paramétrique du test t apparié.

1. Il y a deux groupes ou échantillons dépendants

Comme le nom du test t apparié l'indique, les groupes doivent être dépendants, c'est-à-dire qu'une valeur d'un groupe doit appartenir à une valeur de l'autre groupe.

  • Le poids d'une même personne est mesuré avant et après un régime.
  • Les chercheurs mesurent le poids de personnes qui ont suivi un régime et de personnes qui n'en ont pas suivi.

2. Les variables doivent être échelonnées par intervalles

Dans le test t pour les échantillons dépendants, la différence entre les deux valeurs dépendantes est calculée, puis la valeur moyenne. Cela n'a de sens que si les valeurs sont métriques.

  • Le salaire d'une personne (en euros).
  • Le niveau d'études d'une personne.

3. Les différences entre les valeurs appariées sont normalement distribuées

La différence entre les valeurs appariées doit être normalement distribuée.

  • La différence entre le poids d'une personne à deux moments donnés.
  • La différence dans le nombre de points après avoir lancé deux dés.

Comment fonctionne un test t dépendant ?

Dans le test t dépendant, la différence est calculée à partir de chaque cas apparié. La valeur moyenne est ensuite calculée à partir de ces différences. En fonction de l'importance de la valeur moyenne et de l'erreur standard de la valeur moyenne, une déclaration est faite quant à la probabilité que ce résultat soit le fruit du hasard.

Calculer le test t pour les échantillons dépendants

Pour calculer le test t pour les échantillons dépendants, la différence de chaque paire des deux groupes est d'abord formée. La valeur moyenne x̄diff est ensuite calculée à partir des différences obtenues.

Le calcul de la statistique du test t équivaut maintenant au test t pour un échantillon. S'il n'y a pas de différence entre les deux groupes, la valeur moyenne de la différence x̄diff est nulle. La question est donc de savoir s'il existe une différence entre x̄diff et zéro. La statistique t du test t pour les échantillons dépendants est alors calculée comme suit :

Test t pour échantillons dépendants

Standard error of the mean value est l'erreur standard de la valeur moyenne.

Test t pour échantillons dépendants
  • Difference between the groups = Différence entre les groupes
  • Mean value of the difference between the two groups = Valeur moyenne de la différence entre les deux groupes
  • Sample size = Taille de l'échantillon
  • Standard deviation = Écart-type
  • Standard error of the mean value = Erreur standard estimée de la moyenne
Calculer un test t pour échantillons dépendants

Taille de l'effet d'un test t dépendant

L'indication de la taille de l'effet est très importante pour les études empiriques. La formule suivante permet de déterminer l'ampleur de l'effet dans un test t pour des échantillons dépendants.

Taille de l'effet d'un test t dependant

En général, on peut dire que l'ampleur de l'effet est la suivante :

  • Taille de l'effet r : 0,2 petit effet
  • Taille de l'effet r : 0,5 effet moyen
  • Taille de l'effet r : 0,8 grand effet

Calculer avec DATAtab

Dans l'exemple du test t par paires, on examine si les vacances d'été ont un effet sur la condition physique des étudiants.

La question est donc la suivante : les vacances d'été ont-elles un effet sur la condition physique des étudiants en statistiques ? À cette fin, un test de condition physique est effectué une fois avant et une fois après les vacances pour 10 étudiants en statistiques (2 points de mesure).

Hypothèse nulle H0

La différence moyenne des paires de valeurs mesurées (avant et après les vacances) est nulle. La pause semestrielle n'a aucune influence sur la condition physique des étudiants.

Étant donné que deux résultats de test proviennent toujours d'un même étudiant, il existe une dépendance entre les deux échantillons. C'est pourquoi le test t par paires est utilisé.

Statistiques étudiant Points avant les vacances Points après les vacances
1 60 61
2 70 71
3 40 38
4 41 39
5 40 38
6 40 33
7 45 55
8 48 56
9 30 38
10 50 68

Après avoir copié le tableau supérieur dans la calculatrice de test t, vous pouvez calculer le test t. Les résultats sont les suivants :

Statistiques
n Valeur moyenne Écart-type Erreur standard de la moyenne
Points avant les vacances 10 46.4 11.452 3.622
Points après les vacances 10 49.7 14.095 4.457
Corrélation
n Corrélation
avant les vacances - après les vacances 10 0,847
Test t par paires
t ddl p
avant les vacances - après les vacances -1.39 9 0,197
Intervalle de confiance à 95% de la différence
Moyenne Écart-type Erreur standard de la moyenne Inférieure Supérieure
Points avant les vacances
Points après les vacances
-3.3 7.5 2.37 -8.66 2.06

Interpréter le test t pour les échantillons dépendants

Si la valeur p calculée est inférieure au seuil de signification spécifié (généralement 5 %), l'hypothèse nulle est rejetée, sinon elle est maintenue. Pour l'exemple ci-dessus, les résultats peuvent être rapportés comme suit :

Le score de la variable avant les vacances était plus faible (M = 46,4, SD = 11,452) que le score de la variable après les vacances (M = 49,7, SD = 14,095). Un test t pour les échantillons dépendants a montré que cette différence n'était pas statistiquement significative, t(9) = -1,392 p = 0,197, intervalle de confiance à 95 % [-8,664 ; 2,064].

Il en résulte une valeur p de 0,197 qui est supérieure au seuil de signification défini de 0,05. Le résultat du test t n'est donc pas significatif et l'hypothèse nulle est maintenue. Il est donc supposé que les deux échantillons proviennent de la même population.

Cité DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.net

Contact FAQ et à propos de nous Politique de confidentialité Logiciel de statistiques