Menu

Analyse en composantes principales

L'Analyse en composantes principales est une méthode qui vise à découvrir des structures dans de grands ensembles de variables. Si vous disposez d'un ensemble de données comportant de nombreuses variables, il est possible que certaines d'entre elles soient interdépendantes, c'est-à-dire qu'elles soient corrélées entre elles. Ces corrélations sont la base de l'analyse factorielle.

L'objectif de l'analyse factorielle est de diviser les variables en groupes. L'objectif est de séparer les variables qui sont fortement corrélées de celles qui le sont moins.

Qu'est-ce qu'un facteur?

Dans l'analyse factorielle, le facteur peut être considéré comme une variable cachée qui influence plusieurs variables réellement observées.

Factor Analysis

Ou, en d'autres termes, plusieurs variables sont des phénomènes observables de moins de facteurs sous-jacents.

Dans l'analyse factorielle, on combine donc les variables qui sont fortement corrélées entre elles. On suppose que cette corrélation est due à une variable non mesurable, que l'on appelle un facteur.

Exemple d'analyse factorielle

L'analyse factorielle peut être utilisée pour répondre aux questions suivantes:

  • Quelle structure peut-on détecter dans les données?
  • Comment les données peuvent-elles être réduites à quelques facteurs?

Le tableau suivant contient des exemples de contenu qui montrent où l'analyse factorielle est utilisée dans différents domaines d'expertise.

Exemples

Question Variable Facteurs possibles
Psychologie Les différents traits de personnalité peuvent-ils être regroupés en types de personnalité? Être sociable, être spontané, être curieux, être nerveux, être agressif, etc. Neuroticisme, Extraversion, Ouverture à la nouveauté, Conscience, Compatibilité sociale.
Administration des affaires Comment peut-on résumer les différents types de coûts en caractéristiques de coûts? Coûts matériels, coûts de personnel, coûts d'équipement, coûts fixes, etc. Influençabilité, urgence de la couverture

Questions de recherche Analyse factorielle

Une question de recherche possible pourrait être: Les différents traits de personnalité tels que extraverti, curieux, sociable ou serviable peuvent-ils être regroupés en types de personnalité tels que consciencieux, extraverti ou agréable?

Exploratory Factor Analysis

Vous voulez savoir si certaines caractéristiques telles que sociable, curieux, travailleur, consciencieux, chaleureux ou serviable sont corrélées entre elles et peuvent être décrites par un facteur sous-jacent. Pour le savoir, vous avez créé une petite enquête avec DATAtab.

Vous avez interrogé 20 personnes et fait sortir les résultats dans un tableau Excel. Vous trouvez ici l'ensemble de données d'exemple pour l'analyse en composantes principales avec lequel vous pouvez calculer l'exemple parallèle directement en ligne sur DATAtab sous Calculateur d'analyse factorielle.

Charge factorielle, valeur propre, communités

Les termes importants ou valeurs caractéristiques d'une analyse factorielle sont la charge factorielle, la valeur propre et les communalités. Grâce à eux, il est possible de voir à quel point la corrélation entre les variables individuelles et les facteurs est forte.

Charge factorielle

  • Corrélation entre une variable et un facteur
  • Charge d'une variable sur un facteur

Valeur propre

  • La variance expliquée par un facteur
  • Somme des carrés des charges factorielles

Communautés

  • Variance des variables, qui est expliquée par tous les facteurs
  • Somme des carrés des charges factorielles d'une variable
factor load, eigenvalue, communalities

Matrice de corrélation

La première étape de l'analyse factorielle consiste à calculer la matrice de corrélation. À partir de la matrice de corrélation, on résout le problème dit des valeurs propres, qui est utilisé pour calculer les facteurs.

Correlation Matrix PCA

Analyse factorielle et dimensionnalité

Il est important de noter, cependant, que l'analyse factorielle ne donne pas une réponse "claire" quant au nombre de facteurs à utiliser et à la manière dont ces facteurs peuvent ensuite être interprétés.

Il existe deux méthodes courantes pour déterminer le nombre de facteurs requis, le critère de la valeur propre (critère de Kaiser) et le test du scree.

Critère de la valeur propre (critère de Kaiser)

Afin de déterminer les dimensions, c'est-à-dire le nombre de facteurs, à l'aide du critère des valeurs propres ou du critère de Kaiser, les valeurs propres des facteurs individuels sont nécessaires. Si celles-ci sont calculées, tous les facteurs dont la valeur propre est supérieure à 1 sont utilisés.

Scree-Test

Pour déterminer le nombre de facteurs à l'aide du scree test ou scree plot, les valeurs propres sont triées par taille et représentées par un graphique linéaire. Lorsqu'il y a une courbure dans le graphique, le nombre de facteurs peut être lu.

Scree-Test

En outre, dans le tableau "Variance totale expliquée", on peut lire la variance qui explique chaque facteur individuel et la variance cumulée.

Explained total variance PCA

Communautés

Une fois le nombre de facteurs déterminé, les communalités peuvent être calculées. Comme écrit ci-dessus, la communalité indique la variance des variables, qui est expliquée par tous les facteurs. Si par exemple trois facteurs ont été sélectionnés, les communalités donnent la part de variance de la variable respective à celle avec ces trois facteurs à décrire peut.

Communalities

Matrice des composantes

La matrice des composantes indique les charges factorielles des facteurs sur les variables. Comme le premier facteur explique la plus grande partie de la variance, les valeurs de la première composante ou facteur sont les plus importantes. Avec cette forme de représentation, il est cependant difficile de faire une déclaration sur les facteurs, c'est pourquoi cette matrice est encore tournée.

Component matrix PCA

Matrice de rotation

Le calcul de la matrice des composantes a pour conséquence que le premier facteur est fortement chargé par de nombreuses variables. Il en résulte que la matrice des composantes ne peut généralement pas être interprétée de manière significative. C'est pourquoi une rotation de cette matrice est effectuée. Pour cette rotation, il existe différentes procédures, mais la plus courante est la rotation analytique de Varimax.

Rotation de Varimax

La rotation Varimax permet de s'assurer analytiquement que, pour chaque facteur, certaines variables ont une charge aussi élevée que possible et que les autres variables ont une charge aussi faible que possible. Ceci est obtenu lorsque la variance des charges factorielles par facteur doit être aussi élevée que possible.

Rotation Matrix (Varimax)

Ici, il faut reconnaître que les charges d'extraversion et de sociabilité, d'assiduité et de conscience professionnelle et de chaleur et d'aide sont liées à la compatibilité.

Cité DATAtab: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.net

Contact FAQ et à propos de nous Politique de confidentialité Logiciel de statistiques