Gaceta Sanitaria Gaceta Sanitaria
Nota metodológica
Imputación de valores ausentes en salud pública: conceptos generales y aplicación en variables dicotómicas
Imputing missing data in public health: general concepts and application to dichotomous variables
Gilma Hernándeza,b, David Moriñac,d, Albert Navarrod,,
a Instituto de Investigaciones Médicas, Universidad de Antioquia, Medellín, Colombia
b Programa de Doctorado en Metodología de la Investigación Biomédica y Salud Pública, Departament de Pediatria, d’Obstetricia i Ginecologia i de Medicina Preventiva, Universitat Autònoma de Barcelona, Bellaterra (Cerdanyola del Vallès, Barcelona), España
c Unitat d’Infeccions i Càncer (UNIC), Programa d’Investigació en Epidemiologia del Càncer (PREC), Institut Català d’Oncologia (ICO)-IDIBELL, L’Hospitalet de Llobregat (Barcelona), España
d GRAAL-Unitat de Bioestadística, Facultat de Medicina, Universitat Autònoma de Barcelona, Bellaterra (Cerdanyola del Vallès, Barcelona), España
Autor para correspondencia.
Resumen

Que haya valores ausentes en variables registradas en encuestas de salud es habitual, pero no lo es imputarlos posteriormente cuando se realiza el análisis. Trabajar con datos imputados puede tener ventajas en términos de precisión de los estimadores y de identificación sin sesgos de la asociación entre variables. Probablemente, el proceso de imputación sigue siendo desconocido para muchos profesionales no estadísticos, que le atribuyen una alta complejidad y quizás un objetivo que no es exactamente el que persigue. Para aclarar estas cuestiones, esta nota pretende ofrecer una visión amena, no exhaustiva, del proceso de imputación, que permita conocer sus bondades para el trabajo de un salubrista. Todo ello en el marco de variables dicotómicas, habituales en salud pública. Para ilustrar los conceptos se usa un ejemplo en el cual se trabaja con datos con valores ausentes, imputados de forma simple y múltiple.

Abstract

The presence of missing data in collected variables is common in health surveys, but the subsequent imputation thereof at the time of analysis is not. Working with imputed data may have certain benefits regarding the precision of the estimators and the unbiased identification of associations between variables. The imputation process is probably still little understood by many non-statisticians, who view this process as highly complex and with an uncertain goal. To clarify these questions, this note aims to provide a straightforward, non-exhaustive overview of the imputation process to enable public health researchers ascertain its strengths. All this in the context of dichotomous variables which are commonplace in public health. To illustrate these concepts, an example in which missing data is handled by means of simple and multiple imputation is introduced.

Palabras clave
Valores ausentes, Imputación, Salud pública, Epidemiología
Keywords
Missing data, Imputation, Public health, Epidemiology