Analyse du panier de la ménagère [Analyse d'association]
L'analyse du panier de la ménagère (également appelée analyse d'association) est l'une des principales méthodes utilisées pour découvrir les relations entre les articles. Elle recherche les combinaisons d'articles qui apparaissent fréquemment ensemble dans les transactions. En d'autres termes, elle permet aux détaillants d'identifier les relations entre les articles que les clients achètent.
Que fait l'analyse d'association?
Supposons que vous ayez créé votre propre boutique de vêtements en ligne. Votre objectif est maintenant de réaliser le meilleur chiffre d'affaires possible avec cette boutique.
Afin d'atteindre le chiffre d'affaires le plus élevé possible, vous souhaitez naturellement que chaque client achète le plus possible. Une façon de motiver le client à acheter plus de produits est de lui suggérer plus de produits. La grande question qui se pose maintenant est la suivante: Quel est le meilleur produit à suggérer au client? C'est là que l'analyse du panier de la ménagère ou l'analyse d'association entre en jeu.
L'analyse du panier de la ménagère donne une réponse à la question suivante: Quelle est la probabilité qu'un client achète le produit A s'il a déjà le produit B dans son panier.
L'analyse du panier de la ménagère vous indique quels produits ou marchandises sont souvent achetés ensemble. Ainsi, si un client a déjà un pantalon et des chaussures dans son panier, quelle est la probabilité que ce client achète également une chemise, des chaussettes ou un t-shirt.
Exemple d'analyse du panier de la ménagère
Pour calculer une analyse du panier d'achat, vous avez besoin d'une liste d'achats antérieurs, où vous pouvez voir quels produits ont été achetés ensemble en un seul achat.
Vous avez donc la liste des produits respectifs et chaque ligne correspond à une transaction. Disons que dans votre exemple de données, vous avez les produits suivants: jean, chemise, veste et chaussures.
Chaque ligne correspond à une transaction ou à un achat. 1 signifie acheté, 0 signifie non acheté. La première personne a donc acheté un jean, une chemise et des chaussures.
Maintenant, pour avoir des résultats que nous pouvons interpréter, calculons d'abord une analyse du panier de la ménagère en utilisant DATAtab pour ces données. Pour ce faire, allez au calculateur d'analyse du panier de la ménagèresur DATAtab et copiez vos données dans le tableau.
Maintenant nous pouvons spécifier un support minimum et une confiance minimum. Pour ces données, DATAtab nous a fourni ces règles d'association:
Les règles d'association sont de la forme: Si les produits sous Lhs (Left hand side) sont présents dans une transaction, alors les produits sous Rhs (Right hand side) sont aussi présents avec une certaine probabilité.
Analyse du panier de la ménagère Interpréter les résultats
Nous examinons les résultats de l'analyse du panier de consommation à l'aide du premier ensemble de règles d'association.
Fréquence
La fréquence dans le tableau de résultats nous indique combien de fois les produits sous Lhs et Rhs apparaissent dans une transaction, donc dans notre cas, combien de fois la chemise et les chaussures apparaissent dans une transaction.
Dans notre cas, combien de fois la chemise et les chaussures apparaissent dans une transaction? Comptons le nombre de transactions dans lesquelles ces deux produits apparaissent, soit 8 transactions.
Support
Le support nous indique le pourcentage de toutes les transactions, ou en d'autres termes, la probabilité que la chemise et les chaussures apparaissent dans une transaction. Il suffit donc de diviser la fréquence par le nombre total de transactions.
Nous avons 19 transactions au total, donc nous obtenons 8/19, ce qui est égal à 0,42. La probabilité que la chemise et les chaussures soient présentes dans une transaction est donc de 42 %.
Confiance
La confiance nous dit maintenant, si les produits sous Lhs sont dans une commande, quelle est la probabilité que les produits sous Rhs soient aussi dans le panier.
Dans notre exemple, cela signifie: Quelle est la probabilité que si la chemise se trouve dans le panier, les chaussures s'y trouvent aussi. Nous pouvons calculer cette probabilité en divisant la fréquence de la chemise et des chaussures par la fréquence de la chemise.
L'ascenseur
Et enfin, l'ascenseur. L'ascenseur indique le facteur par lequel la probabilité d'acheter les produits de la droite augmente si les produits de la gauche ont déjà été achetés. Donc, dans notre exemple. Si le produit Chemise est dans le panier, il est 1,27 fois plus probable que Chaussures soit acheté que si le produit Chemise n'est pas dans le panier.
Analyse du panier d'achat et exploration de données
L'analyse du panier d'achat est une méthode issue du domaine de l'exploration de données. Selon la quantité de données disponibles, l'analyse peut être très exigeante en termes de calcul.
Cependant, avec l'algorithme Apriori, il existe des méthodes très efficaces pour déterminer les règles d'association.
Note critique sur l'analyse du panier de la ménagère
Supposons que votre analyse du panier de la ménagère montre que si une personne achète un pantalon et des chaussures, il y a une forte probabilité qu'elle achète également une chemise. Vous proposez donc une chemise à tous les clients qui achètent un pantalon et des chaussures. Cela augmente la probabilité qu'une chemise soit achetée dans ces conditions et une autre analyse du panier de la ménagère sera falsifiée.