
Tutoriel : Comment identifier des valeurs influentes et que faire le cas échéant ?
Comment les détecter ?
En régression linéaire ou logistique, les distances de Cook sont couramment utilisées pour détecter des valeurs influentes (lorsque la valeur absolue est supérieure à 1).
Quelles conséquences ?
La robustesse du modèle peut être mise en cause. En effet, si ces individus n'étaient pas observés, les résultats différeraient considérablement.
Que faire ?
Vous pouvez vérifier les données concernant ces individus, afin de vous assurer qu'il n'y a pas d'erreur de saisie, d'unité de mesure, ou autre.