Menu

Qu'est-ce que la valeur p ?

La valeur p indique la probabilité que le résultat observé ou un résultat encore plus extrême se produise si l'hypothèse nulle est vraie.

La valeur p est utilisée pour décider si l'hypothèse nulle est rejetée ou conservée (non rejetée). Si la valeur p est inférieure au seuil de signification défini (souvent 5 %), l'hypothèse nulle est rejetée, sinon elle ne l'est pas.

Vous souhaitez avoir un renseignement sur la population et avez établi une hypothèse à cet effet. Comme il n'est généralement pas possible de sonder l'ensemble de la population, vous interrogez un échantillon. Or, cet échantillon, du fait du hasard, s'écartera très probablement de la population.

Échantillon de population et valeur p

Si l'hypothèse nulle s'applique à votre population, par exemple que le salaire des hommes et des femmes ne diffère pas en Allemagne, il y aura certainement une différence dans l'échantillon, par exemple une différence de 300 euros par mois. La valeur p vous indique la probabilité qu'une différence de 300 euros ou plus se produise par hasard dans l'échantillon s'il n'y a pas de différence dans la population.

Si le résultat a une probabilité très faible, vous pouvez bien sûr vous demander si l'hypothèse concernant la population est vraie.

Si la valeur p est de 3 %, par exemple, il n'y a que 3 % de chances que l'on obtienne un échantillon dans lequel les salaires des hommes et des femmes diffèrent de plus de 300 euros.

Quand la valeur p est-elle utilisée ?

La valeur p est utilisée pour rejeter ou conserver (ne pas rejeter) l'hypothèse nulle dans un test d'hypothèse. Si la valeur p calculée est inférieure au seuil de signification, qui est dans la plupart des cas de 5 %, l'hypothèse nulle est rejetée, sinon elle est maintenue.

Valeur p

Exemple :

  • L'hypothèse nulle est qu'il n'y a pas de différence entre les salaires des hommes et des femmes.
  • On prélève un échantillon avec les salaires des hommes et des femmes. Voici les résultats observés.
  • Nous supposons que l'hypothèse nulle est vraie, c'est-à-dire qu'il n'y a pas de différence entre les salaires des hommes et des femmes.
  • Dans le résultat observé (échantillon), nous constatons que les hommes gagnent 150 € de plus par mois que les femmes.
  • La valeur p indique maintenant la probabilité de tirer un échantillon dans lequel le salaire des hommes et des femmes diffère de 150 € ou plus, même s'il n'y a pas de différence dans la population.
  • Si la valeur p est par exemple de 0,04, il n'y a que 4 % de chances de tirer un échantillon de 150 € ou plus de différence, s'il n'y a pas de différence de salaire dans la population.

Admettons qu'une valeur p de 0,04 ou de 4 % soit obtenue dans le cas supérieur, qu'est-ce que cette valeur p signifie maintenant ? Cela signifie que s'il n'y a pas de différence de salaire dans la population, il n'y a que 4 % de chances de tirer un échantillon dont le montant de la différence de salaire soit supérieur ou égal à 150 €.

La probabilité de 4 % est évidemment très faible, de sorte que l'on peut se demander s'il est vrai que les hommes et les femmes de la population gagnent le même salaire ou si cette hypothèse doit plutôt être rejetée.

La question de savoir à partir de quand l'hypothèse nulle est rejetée relève du niveau de signification.

Niveau de signification

Le niveau de signification est déterminé avant le test. Si la valeur p calculée est inférieure à cette valeur, l'hypothèse nulle est rejetée, sinon elle est maintenue. En règle générale, on choisit un niveau de signification de 5 %.

  • alpha < 0,01 : résultat très significatif.
  • alpha < 0,05 : résultat significatif.
  • alpha > 0,05 : résultat non significatif.

Le seuil de signification indique la probabilité d'une première erreur de type. Qu'est-ce que cela signifie ? Si la valeur p est de 5 % et que l'hypothèse nulle est rejetée, la probabilité que l'hypothèse nulle soit valide est de 5 %, c'est-à-dire qu'il y a une probabilité de 5 % de se tromper. Si la valeur critique est réduite à 1 %, la probabilité d'erreur n'est donc plus que de 1 %, mais il est également plus difficile de confirmer l'hypothèse alternative.

Valeurs p unilatérales

Supposons que vous examiniez le temps de réaction de deux groupes. Souvent, il n'est pas intéressant de savoir s'il y a une différence entre les deux groupes, mais si un groupe a une valeur plus grande ou plus petite que l'autre. Dans ce cas, vous devez formuler une hypothèse dirigée et calculer ce que l'on appelle une valeur p unilatérale.

Une valeur p unilatérale inclut des valeurs plus extrêmes que le résultat obtenu dans une direction, cette direction ayant été précisée à l'avance.

Une valeur p bilatérale inclut des valeurs plus extrêmes dans les deux sens, positif et négatif.

La valeur p unilatérale est alors obtenue en divisant la valeur p bilatérale par 2. Ici, bien sûr, il faut veiller à ce que la différence ou l'effet considéré aille dans le sens de l'hypothèse alternative.

Exemple

Votre hypothèse alternative est que les valeurs de temps de réaction du groupe A sont supérieures à celles du groupe B. En analysant vos données, vous obtenez une valeur p bilatérale de 0,04.

Vous devez maintenant vérifier si le groupe A présente réellement des valeurs plus élevées dans vos données. Si c'est le cas, la valeur p bilatérale est divisée par deux, ce qui donne 0,02.

Si ce n'est pas le cas et que l'effet ou la différence va exactement dans l'autre sens que celui formulé dans l'hypothèse alternative, votre valeur p est de 1-0,02, soit 0,98.

Plus simplement avec DATAtab, il vous suffit de spécifier le type d'hypothèse que vous avez, et DATAtab vous aidera à l'évaluer.

Calculer la valeur p

Pour calculer la valeur p, il faut d'abord trouver un test d'hypothèse approprié. Si le test d'hypothèse approprié est trouvé, vous pouvez calculer la valeur p dans la calculatrice de statistiques de DATAtab. Les tests d'hypothèse les plus connus sont les suivants

Le calcul de la valeur p nécessite une fonction de distribution qui décrit les réalisations ou les tirages de l'échantillon. Si cette fonction de distribution est connue, il est possible de déterminer la probabilité qu'un échantillon tiré soit inférieur ou égal à une valeur donnée. Les représentants classiques de ces distributions sont la distribution t et la distribution du Khi-deux.

Distribution du Khi-deux

la valeur p en statistiques

Tests statistiques et valeur p

Pour rejeter ou maintenir une hypothèse, on a besoin de la valeur p. La procédure d'utilisation de la valeur p pour les tests statistiques est maintenant la suivante :

  • Définition de la valeur p critique ou du seuil de signification, par exemple 5 %.
  • Définition d'une procédure de test statistique, par exemple, les tests t ou l'analyse de corrélation.
  • Calcul des statistiques du test à partir de l'échantillon, par exemple, la valeur t dans le test t.
  • Détermination de la valeur p pour les statistiques du test, par exemple, valeur p pour un t donné dans le test t.
  • Vérifier si la valeur p est supérieure ou inférieure à la valeur p critique spécifiée valeur p 1% de fuites sous la valeur critique de 5 %.

Cité DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.net

Contact FAQ et à propos de nous Politique de confidentialité Logiciel de statistiques