Identifier et hiérarchiser des facteurs
La problématique :
Vous disposez d’un grand ensemble de données et vous souhaitez comprendre quels sont les facteurs qui influencent un comportement (d’un client, d’une entreprise, d’un matériel…). Au-delà d’identifier ces facteurs, vous souhaitez en fin de compte les hiérarchiser afin de discriminer ce qui est important de ce qui l’est moins. Vous saurez ainsi sur quels leviers agir prioritairement pour améliorer vos performances.
Notre apport :
Dans une première étape, nous définissons avec vous les objectifs de la mission. Quels sont les facteurs en prendre en compte ? Quelles sont les données en présence ? Quels sont les comportements à étudier ?
La deuxième étape consiste à préparer les données pour l’analyse (valeurs aberrantes, valeurs manquantes..) et à produire des statistiques descriptives afin de prendre connaissance des informations présentes dans les données.
L’analyse multivariée permettra dans un premier temps de sélectionner les facteurs à prendre en compte. En effet, il s’agit de repérer dans un grand ensemble les variables les plus intéressantes pour l’analyse (non redondante par exemple..). Enfin, une hiérarchisation de ces facteurs peut être effectuée, par exemple en évaluant la contribution de chaque facteur à la qualité de l’estimation d’un modèle.
Les méthodes statistiques envisagées :
- Analyse en composantes principales
- Analyse factorielle des correspondances
- Analyse des correspondances multiples
- régression linéaire simple ou multiple
- régression logistique
- méthodes de classification
- ….