Pour une utilisation optimale, veuillez visiter DATAtab sur votre PC de bureau !

Calculez:
Variables métriques:

Comment faire

Calculatrice de regroupement k-means

Voulez-vous savoir quelle structure est présente dans vos données ? Utilisez alors la calculatrice d'analyse en grappes de DATAtab et sélectionnez au moins deux variables métriques. Les analyses de clusters vous permettent de découvrir des structures de similarité dans vos données.

Voulez-vous calculer une analyse de cluster ? Trois étapes suffisent :

  • Copiez vos données dans le tableau
  • Sélectionnez plusieurs variables
  • Sélectionnez le nombre de grappes que vous souhaitez calculer.

Les grappes peuvent être calculées à l'aide de différentes méthodes de regroupement. Celles-ci peuvent être divisées en

  • graphique-théorique
  • hiérarchique
  • partitionnement
  • optimisation

DATAtab vous calcule le cluster k-means et le cluster hiérarchique. L'algorithme affecte chaque point de données au groupe dont le centre (ou "centroïde") est le plus proche. Les centroïdes sont recalculés après chaque affectation, et le processus est répété jusqu'à ce que les grappes ne changent plus de manière significative. Cela permet d'identifier des modèles ou des structures dans les données.

Calculateur de k-moyennes en ligne

La méthode k-Means, développée par MacQueen (1967), est l'une des méthodes non hiérarchiques les plus utilisées. Il s'agit d'une méthode de partitionnement, particulièrement adaptée aux grandes quantités de données.

  • Tout d'abord, une partition initiale avec k grappes (nombre donné de grappes) est créée.
  • Ensuite, en commençant par le premier objet de la première grappe, les distances euclidiennes de tous les objets avec les centroïdes de chaque grappe sont calculées.
  • Si un objet est détecté à une distance au centre de gravité de sa propre grappe supérieure à la distance au centre de gravité (centroïde) d'une autre grappe, cet objet est déplacé vers l'autre grappe.
  • Enfin, les centroïdes des deux grappes modifiées sont à nouveau calculés, étant donné que les compositions ont changé ici.
  • Ces étapes sont répétées jusqu'à ce que chaque objet soit situé dans une grappe ayant la plus petite distance à son centroïde (centre de la grappe) (solution optimale).
Calculatrice de k-Means

Nombre optimal de grappes

Le nombre de grappes dans la méthode k-Means doit être déterminé au préalable et n'est donc pas déterminé par la méthode des grappes. Mais quel est le nombre optimal de grappes dans la méthode k-Means ? La méthode du coude est un moyen courant de déterminer le nombre approprié de grappes.

Courbe coudée

Lorsque vous souhaitez calculer une analyse par grappes, la grande question est souvent de savoir combien de grappes il faut prendre. La méthode du coude vous aide à répondre à cette question ! À chaque nouvelle grappe, la variation totale dans chaque grappe devient de plus en plus petite. Dans le cas extrême, lorsqu'il y a autant de grappes que de points, le résultat est nul. Cependant, dans la plupart des cas, la réduction de la variation totale devient plus faible à partir d'un certain point. Ce point est alors utilisé comme le nombre optimal de grappes.

Courbe coudée

Mise à l'échelle des données pour le regroupement par k-moyennes

Si les variables considérées n'ont pas la même unité, il est souvent conseillé de mettre les données à l'échelle avant l'analyse en grappes.

Cité DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.net

Contact FAQ et à propos de nous Politique de confidentialité Logiciel de statistiques