Pour une utilisation optimale, veuillez visiter DATAtab sur votre PC de bureau !
Voulez-vous savoir quelle structure est présente dans vos données ? Utilisez alors la calculatrice d'analyse en grappes de DATAtab et sélectionnez au moins deux variables métriques. Les analyses de clusters vous permettent de découvrir des structures de similarité dans vos données.
Voulez-vous calculer une analyse de cluster ? Trois étapes suffisent :
Les grappes peuvent être calculées à l'aide de différentes méthodes de regroupement. Celles-ci peuvent être divisées en
DATAtab vous calcule le cluster k-means et le cluster hiérarchique. L'algorithme affecte chaque point de données au groupe dont le centre (ou "centroïde") est le plus proche. Les centroïdes sont recalculés après chaque affectation, et le processus est répété jusqu'à ce que les grappes ne changent plus de manière significative. Cela permet d'identifier des modèles ou des structures dans les données.
La méthode k-Means, développée par MacQueen (1967), est l'une des méthodes non hiérarchiques les plus utilisées. Il s'agit d'une méthode de partitionnement, particulièrement adaptée aux grandes quantités de données.
Le nombre de grappes dans la méthode k-Means doit être déterminé au préalable et n'est donc pas déterminé par la méthode des grappes. Mais quel est le nombre optimal de grappes dans la méthode k-Means ? La méthode du coude est un moyen courant de déterminer le nombre approprié de grappes.
Lorsque vous souhaitez calculer une analyse par grappes, la grande question est souvent de savoir combien de grappes il faut prendre. La méthode du coude vous aide à répondre à cette question ! À chaque nouvelle grappe, la variation totale dans chaque grappe devient de plus en plus petite. Dans le cas extrême, lorsqu'il y a autant de grappes que de points, le résultat est nul. Cependant, dans la plupart des cas, la réduction de la variation totale devient plus faible à partir d'un certain point. Ce point est alors utilisé comme le nombre optimal de grappes.
Si les variables considérées n'ont pas la même unité, il est souvent conseillé de mettre les données à l'échelle avant l'analyse en grappes.
Cité DATAtab: DATAtab Team (2023). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.net