Exponer la posible problemática en el cálculo de riesgos en bases de datos agregadas cuando el fenómeno estudiado es recurrente y presentar la distribución binomial negativa como una alternativa válida y sencilla para analizar este tipo de fenómeno.
MétodosEn el contexto de los fenómenos recurrentes, el análisis mediante la regresión de Poisson puede provocar sobredispersión o variancia extra-Poisson. Esto conduce a la subestimación de los errores estándares de los coeficientes, pudiendo derivar en la significación estadística de factores que realmente no estén asociados con el fenómeno. La binomial negativa puede captar parte de la variancia que no identifica la regresión de Poisson. Para comprobarlo se comparó ambas distribuciones sobre el número de hospitalizaciones que presentaron individuos, entre 65 y 69 años de edad, durante el año 1996. Esta comparación fue realizada en dos bases de datos agregadas distintas: por individuo y según las variables de interés.
ResultadosEl ajuste mediante ambas distribuciones presenta diferencias en las dos bases de datos. Según el estudio de los residuos, en la base por individuo la binomial negativa ajusta correctamente el 67,9% de las observaciones mal ajustadas por la regresión de Poisson. Este porcentaje es del 50% en la base agregada según las variables. Además, en ambos casos, la regresión de Poisson estima significativas cuatro de las seis variables estudiadas. Para la binomial negativa son dos en la base por individuo y una en la base por variables.
ConclusionesLa existencia de sobredispersión es frecuente en fenómenos recurrentes. Cuando esto sucede, el uso de la binomial negativa es más apropiado que el de la regresión de Poisson.
The aim is to unfold the difficulties likely to arise in risk calculations through aggregated database when the studied phenomenon is recurrent and to display the negative binomial distribution as a valid and simple alternative to analyse this kind of phenomenon.
MethodsWhen the studied phenomenon is recurrent, the analysis by means of the Poisson regression can provoke overdispersion or extra-poisson variance, what leads to underestimating the standard errors in coefficients and may divert into the statistical significance of factors which as a matter of fact are not associated with the phenomenon beforehand. The negative binomial can grasp part of the variance which the Poisson is unable to identify. In order to check this out, the fit of both distributions were compared, based on the number of hospitalizations of individuals aged between 65 and 69, during 1996. This comparison was carried out by means of two different aggregated databases: by individuals and by variables.
ResultsThere were differences in the fitted models by means of both distributions in both databases. By the analysis of the residuals, when using the base by individuals, the negative binomial fits correctly 67.9% of the observations badly fitted by the Poisson. Using the aggregated variables database, the percentage is 50%. In both cases, Poisson estimates four out of the six studied variables as significant. As to the negative binomial, there are two significant based on individuals and one in the variable database.
ConclusionThe existence of overdispersion is frequent in recurrent-type phenomena. When this occurs, the negative binomial distribution is more appropiate than the Poisson.