Données manquantes

Presque toutes les études ont des observations manquantes. Pourtant, les manuels et les logiciels supposent généralement que les données sont complètes et le sujet de la gestion des données manquantes n’est pas souvent abordé en dehors des revues statistiques. Il existe plusieurs types de données manquantes et différentes raisons pour lesquelles les données manquent. Les deux problèmes affectent l’analyse. Quelques exemples: (1) Dans une enquête par questionnaire postal, toutes les personnes sélectionnées ne répondent pas (2) Dans un essai randomisé, certains patients sont perdus de vue avant la fin de l’étude (3) Dans une étude multicentrique certains centres (4) Dans une étude où les patients sont évalués fréquemment, certaines données sont manquantes à certains moments pour des raisons inconnues (5) Des valeurs de données occasionnelles pour une variable sont manquantes parce que certains équipements ont échoué; (7) Dans une étude d’imagerie par résonance magnétique, certains patients très obèses sont exclus car ils sont trop gros pour la machine (8). Dans une étude évaluant la qualité de vie, certains patients meurent La principale préoccupation est toujours de savoir si les données disponibles seraient biaisées. Si le fait qu’une observation est manquante n’est pas lié à la valeur non observée (et donc au résultat du patient) et que les données disponibles sont appelées “ manquant complètement au hasard. ” Pour les cas 5 et 6 ci-dessus, ce serait une hypothèse sûre. Parfois, les données manquent d’une manière prévisible qui ne dépend pas de la valeur manquante elle-même mais qui peut être prédite à partir d’autres données — comme dans le cas 3. Confusément, cela s’appelle “ manquant au hasard. &#X0201d ; Dans les cas courants 1 et 2, cependant, les données manquantes dépendent probablement de valeurs non observées, appelées “ manquant pas au hasard, &#x0201d ;, et par conséquent leur manque peut conduire à des biais. En général, il est important de être en mesure d’examiner si les données manquantes peuvent avoir introduit un biais. Par exemple, si nous ne savons rien du tout sur les non-répondants à une enquête, nous ne pouvons pas faire grand-chose pour explorer les biais possibles. Ainsi, un taux de réponse élevé est nécessaire pour obtenir des réponses fiables.1 Parfois, cependant, certaines informations sont disponibles. Par exemple, si l’échantillon de l’enquête est choisi dans un registre qui comprend l’âge et le sexe, les répondants et les non-répondants peuvent être comparés sur ces variables.À tout le moins, cela donne des indications sur la représentativité de l’échantillon. Les non-répondeurs ont souvent (mais pas toujours) un pronostic médical pire que ceux qui répondent. Quelques observations manquantes sont une nuisance mineure, mais une grande quantité de données manquantes est une menace majeure pour l’intégrité d’une étude. La non-réponse est un problème particulier dans les études appariées, comme certaines études de cas-témoins, car on ne sait pas comment analyser les données des individus non appariés. La perte de patients réduit également la puissance de l’essai. Lorsque des pertes sont prévues, il est judicieux d’augmenter la taille de l’échantillon cible pour tenir compte des pertes. Cependant, ces données sont beaucoup plus courantes dans les études rétrospectives, dans lesquelles les données recueillies régulièrement sont ensuite utilisées dans un but différent.2 Lorsque des informations sont recherchées dans les notes médicales des patients, les notes ne disent souvent pas si ou pas un patient était un fumeur ou avait une procédure particulière effectuée. Il est tentant de supposer que la réponse est non quand il n’y a aucune indication que la réponse est oui, mais c’est généralement imprudent. Aucune solution vraiment satisfaisante n’existe pour les données manquantes, c’est pourquoi il est important d’essayer de maximiser la collecte de données. Les principaux moyens de traiter les données manquantes dans l’analyse sont les suivants: (a) omettre des variables qui ont de nombreuses valeurs manquantes; (b) omettre des personnes qui n’ont pas de données complètes; et (c) estimer (imputer) ce que les valeurs manquantes étaient. Offrir à tout le monde sans données complètes est connu comme analyse complète de cas (ou de cas disponibles) et est probablement l’approche la plus courante. Lorsque très peu d’observations manquent, peu de dommages seront causés, mais lorsque plusieurs omettent tous les patients sans données complètes, une grande partie des données risquent d’être rejetées, avec une perte importante de puissance statistique. Les résultats peuvent être biaisés à moins que les données manquent complètement au hasard. En général, il est conseillé de ne pas inclure dans une analyse une variable qui n’est pas disponible pour une grande partie de l’échantillon. L’approche alternative principale à la suppression de cas est l’imputation, où les valeurs manquantes sont remplacées par une valeur plausible prédite à partir des données disponibles de cette personne. L’imputation a fait l’objet de beaucoup de travaux méthodologiques récents; Sam Wystan Poshela Mhlongo a été éduqué à Soweto et était fier d’être un zoulou avec un lien maternel à la Maison Royale. Il s’opposa à l’apartheid et fut emprisonné à Robben Island, où il était proche de Nelson Mandela et très influencé par lui. Il s’exila d’Afrique du Sud via le Botswana, étudia la médecine à Londres et devint médecin généraliste à Londres. Il a été président de l’Association médicale afro-antillaise en 1992. En 1998, il est retourné en Afrique du Sud à une chaire de fondation à MEDUNSA (Université médicale d’Afrique australe, maintenant Université du Limpopo) à l’invitation de l’Autorité sanitaire du Gauteng et de l’université. Le président Mbeki l’a nommé conseiller sur la santé familiale chargé de corriger les problèmes historiques et de développer les services dans les nouvelles communautés de la région de Johannesburg. Un tel problème était la différence marquée des extrapolations de la prévalence régionale et sexuelle du VIH / SIDA, liée en grande partie aux inexactitudes et réactions croisées dans les tests sérologiques. Indépendamment, ces inexactitudes avaient conduit une équipe d’experts de Harvard à les abandonner dans leurs enquêtes en Afrique. Mbeki, conscient de ces anomalies et d’autres anomalies, a mis en place un groupe consultatif présidentiel avec des experts internationaux indépendants en 1999 pour enquêter sur les raisons de ces incidents et sur les allégations de l’ONUSIDA selon lesquelles le VIH / SIDA était plus répandu en Afrique du Sud que dans tout autre pays. les enquêteurs locaux savaient que cela était lié au sexe et ont donné la priorité à MEDUNSA pour enquêter sur un excès apparent de VIH / SIDA périnatal. Lors de ses délibérations avec des membres expérimentés de la Commission présidentielle, dont Luc Montagnier, il a attiré l’attention sur la nécessité de nouvelles approches pour sortir de l’impasse qui a conduit les auteurs et les souscripteurs de la déclaration millénaire de Durban à déclarer: en vue ” à une pandémie de VIH / SIDA. Il est devenu connu comme un adversaire africain bien qualifié d’un tel pessimisme, surtout de la part des étrangers ignorant que la sagesse locale à tous les niveaux explorait des initiatives pour surmonter les inégalités innée entre les sexes, les régions et les groupes socioéconomiques dans la société la plus riche et la plus avancée. Dans ces domaines et dans d’autres, Mhlongo garde un souvenir chaleureux d’une préoccupation, d’un engagement et d’un courage authentiques et inspirés que lui et quelques collègues ont entretenus face au dénigrement et aux menaces locales et internationales. Pour ses nombreux amis, la communauté, le pays et la médecine internationale, il laisse un vide dans la sensibilisation et la compétence qui sera très difficile à combler.Pour sa famille, cette perte soudaine d’un homme sincère et génial est une tristesse dévastatrice. Il laisse sa seconde épouse, Maria Giacomin, du Brésil et leurs deux fils, et sa première femme, Anne Morgan, ainsi que leur fille et leurs deux petits-fils.Sam Wystan Poshela Mhlongo, professeur de médecine familiale MEDUNSA (née en 1940 à Charing Cross, Londres) , 1976, MSc, MRCGP); mort le 6 octobre 2006 lors d’une collision avec un camion rentrant chez lui.