Test du rang logarithmique
Qu'est-ce que le test du logarithme des rangs? Le test du logarithme des rangs est utilisé dans l'analyse du temps de survie et compare la distribution du temps écoulé avant l'apparition d'un événement pour deux échantillons indépendants ou plus.
Nous allons maintenant examiner chacun des points, étape par étape. Que signifie "distribution", que signifie "temps jusqu'à la survenue d'un événement" et que signifie "deux échantillons indépendants ou plus"? Commençons par le dernier point, la question de deux échantillons indépendants ou plus.
Exemple de test de rang logique
Le test du logarithme des rangs vous permet de vérifier s'il existe une différence entre deux ou plusieurs groupes différents.
Par exemple, vous pouvez chercher à savoir s'il existe une différence entre deux matériaux différents utilisés pour une obturation dentaire.
La question suivante est la suivante: par rapport à quoi existe-t-il une différence? Le test du logarithme des rangs vérifie s'il existe une différence dans le temps qui s'écoule avant qu'un événement ne se produise.
Que signifie "délai avant qu'un événement ne se produise"? Le test des rangs logarithmiques examine une variable qui a une heure de début et une heure de fin lorsqu'un certain événement se produit.
Le test de rang logique prend en compte le temps écoulé entre l'heure de début et l'événement. Ce délai peut être mesuré en jours, en semaines ou en mois.
Dans notre exemple, nous pourrions nous intéresser à la question de savoir si le matériau a une influence sur le temps après lequel l'obturation dentaire éclate à nouveau.
Dans cet exemple, nous avons un point de départ, qui est le moment où l'obturation est posée. Nous avons également un point final ou un événement, qui est le moment où l'obturation se rompt à nouveau.
Nous nous intéressons au temps qui s'écoule entre le point de départ et le point d'arrivée, c'est-à-dire le temps qui s'écoule entre l'insertion de l'obturation et la rupture de l'obturation.
Comment comparer le temps respectif jusqu'à ce que le plombage éclate à nouveau chez les sujets testés?
Nous le faisons à l'aide de la courbe de Kaplan Meier ou du tableau utilisé pour créer ce graphique. Ici, le temps est représenté sur l'axe des x et le taux de survie sur l'axe des y.
Qu'est-ce que le taux de survie? La courbe de Kaplan Meier nous indique la probabilité qu'une obturation dure plus longtemps qu'un certain laps de temps.
Supposons que vous souhaitiez connaître la probabilité qu'un plombage dure plus de 5 ans. Dans ce cas, vous pouvez lire sur la courbe de Kaplan Meier qu'il y a 70 % de chances qu'une obturation dure plus de 5 ans.
Mais nous voulons maintenant vérifier s'il existe une différence entre deux matériaux, et nous inscrivons donc les deux courbes dans le graphique.
La question à laquelle le test du logarithme des rangs répond maintenant est la suivante: "Existe-t-il une différence significative entre les deux matériaux? Existe-t-il une différence significative entre les deux courbes? En d'autres termes, le matériau d'obturation a-t-il une influence sur le "temps de survie" de l'obturation dentaire?
Hypothèses du test du logarithme des rangs
Nous en venons maintenant à l'hypothèse nulle et à l'hypothèse alternative du test du logarithme des rangs.
- Hypothèse nulle: Les deux groupes ont des courbes de distribution identiques.
- Hypothèse alternative: Les deux groupes ont des courbes de distribution différentes. Hypothèses du test du logarithme des rangs.
Ainsi, comme toujours avec un test d'hypothèse statistique, vous obtenez une valeur p à la fin du test de rang logarithmique.
La question est de savoir si cette valeur p est supérieure ou non au seuil de signification. Le seuil de signification est fixé à 0,05 dans la plupart des cas.
Si la valeur p calculée est supérieure à 0,05, l'hypothèse nulle est retenue. Sur la base des données disponibles, on suppose alors que les deux groupes ont la même courbe de distribution.
Si la valeur p est inférieure à 0,05, l'hypothèse nulle est rejetée.
Calcul du test du logarithme des rangs
Dans l'étape suivante, nous examinerons les formules du test du logarithme des rangs et la manière dont il est calculé à la main.
Supposons que nous ayons un groupe 1 et un groupe 2 et que nous voulions tester si les deux groupes ont la même fonction de temps de survie ou non.
Nous voyons ici les moments où soit un événement s'est produit, soit le cas respectif a été censuré. Dans ce cas, "1" signifie que l'événement s'est produit, "0" signifie que le cas a été censuré.
Si nous reprenons notre exemple précédent avec les matériaux de remplissage, les groupes auraient chacun reçu des matériaux différents pour le remplissage. Si nous supposons que le temps est mesuré en années, le premier remplissage du groupe 1 aurait échoué au bout de deux ans, le second au bout de trois ans, et ainsi de suite.
Pour calculer un test de rang logarithmique, nous devons combiner les deux tableaux. Pour ce faire, nous commençons par noter tous les points dans le temps qui se produisent dans les groupes.
Il s'agit de 2, 3, 4, 6, 7 et 8. Il est important que les moments où seuls des cas ont été censurés ne soient pas inclus dans le tableau. Au temps 5, un cas a été censuré, mais sinon le temps 5 ne se produit pas, donc nous n'incluons pas le temps 5 dans ce tableau.
Comme pour la courbe de Kaplan Meier, nous remplissons ensuite les colonnes m, q et n pour les groupes 1 et 2, respectivement. m nous indique exactement combien de personnes ont eu un événement à ce moment-là.
Pour le groupe 1, après deux ans, une obturation s'est rompue, après trois ans, encore une obturation, aux temps 4 et 6, rien ne s'est produit, au temps 7, deux obturations se sont rompues et au temps 8, une seule.
q nous indique à quel moment le nombre de cas a été censuré. Ici, nous n'avons que le temps 5. Puisque, comme nous l'avons déjà dit, nous n'avons pas repris ce moment dans le tableau, cette valeur est attribuée au moment suivant le plus proche, donc à 4, ce qui fait qu'il y a un 1 ici.
Nous pouvons faire de même pour le deuxième groupe. À partir des tableaux ainsi générés, nous pouvons maintenant calculer les valeurs dites attendues. Pour le groupe 1, cela se fait à l'aide de cette équation et pour le groupe 2 à l'aide de cette formule.
Examinons de plus près le premier cas. n1 est 6 et n2 est également 6, nous avons donc 6 divisé par 6 plus 6 et m1 est 1 et m1 est 2, nous avons donc 1 plus 2. On obtient donc 1,5. Nous répétons cette opération pour toutes les lignes et pour les deux groupes.
Nous avons maintenant besoin des valeurs observées moins les valeurs attendues. Pour cela, il suffit de calculer m1 moins e1 ou m2 moins e2.
Nous obtenons ces valeurs pour chaque groupe.
Nous pouvons maintenant calculer ce que l'on appelle la statistique du logarithme du rang. Pour ce faire, nous pouvons utiliser soit les valeurs du groupe 1, soit celles du groupe 2. Dans le cas présent, nous prenons simplement les valeurs du groupe 2.
L'addition de ces valeurs donneO2 moins E2, soit 1,15. Mais quelle est la variance de ce résultat? La variance est donnée par la formule suivante.
Nous calculons d'abord cette expression pour chaque ligne, puis nous l'additionnons. Dans notre cas, nous obtenons 1,78.
Avec cela, nous pouvons maintenant calculer la statistique de rang logarithmique. Dans notre exemple, nous obtenons 0,74.
La statistique de rang logarithmique correspond à une valeur de Chi2. Par conséquent, la valeur p critique peut être déterminée à l'aide de la distribution du Chi2. Les degrés de liberté requis résultent du nombre de groupes moins 1.
Calculer le test du log rank avec DATAtab
Vous vous demandez maintenant quelle est la manière la plus simple de calculer le test du logarithme des rangs? La meilleure façon est de le faire en ligne avec DATAtab. Les étapes sont les suivantes: Vous allez d'abord sur le (1) calculateur de statistiques sur datatab.fr et vous (2) copiez vos propres données dans le tableau. Ensuite (3), vous cliquez sur "Plus" et sur l'onglet (4) Analyse de survie.
Ici, nous avons une colonne avec le temps, puis une colonne qui nous indique si l'événement s'est produit ou non. Ici, 1 signifie "survenu" et 0 signifie "censuré". Ensuite, nous avons la variable Matériau avec les deux matériaux A et B.
En fonction de ce que vous sélectionnez ici, les méthodes appropriées seront calculées pour vous.
Si vous ne sélectionnez que la variable Temps, la courbe de survie de Kaplan-Meier sera affichée avec le tableau correspondant. Si vous ne sélectionnez pas de variable avec l'état, il est supposé qu'aucun cas n'est censuré. Si ce n'est pas le cas, vous pouvez simplement cliquer ici sur "Statut" sur la variable qui contient les données indiquant si l'événement s'est produit ou non.
Si un autre facteur est sélectionné, par exemple le matériau, le test log-rank est calculé dans ce cas. Vous pouvez lire l'hypothèse nulle et l'hypothèse alternative et obtenir les résultats du test du logarithme des rangs.
L'hypothèse nulle est la suivante: Il n'y a pas de différence entre les groupes A et B en termes de distribution du temps jusqu'à ce que l'événement se produise.
L'hypothèse alternative est la suivante: Il existe une différence entre les groupes A et B en ce qui concerne la distribution du temps écoulé jusqu'à ce que l'événement se produise.
Ci-dessous, vous pouvez lire les résultats et vous pouvez voir la valeur p pour le test du logarithme des rangs.
Si vous ne savez pas exactement comment cela est interprété, vous pouvez simplement cliquer sur Résumé en toutes lettres:
Un test de log-rank a été calculé pour déterminer s'il existe une différence entre les groupes A et B en termes de distribution du temps jusqu'à ce que l'événement se produise.
Pour les données en question, le test du log-rank a montré qu'il existe une différence entre les groupes en termes de distribution du temps jusqu'à ce que l'événement se produise, p=<0,001. L'hypothèse nulle est donc rejetée.
Cela signifie que si la valeur p est supérieure au seuil de signification prédéterminé, qui est dans la plupart des cas de 5 %, l'hypothèse nulle est retenue, c'est-à-dire qu'il n'y a pas de différence significative.
Si la valeur p est plus petite, l'hypothèse nulle est rejetée et l'on suppose, sur la base des données disponibles, qu'il existe une différence entre les courbes.