Journal Information
Vol. 15. Issue 5.
Pages 447-452 (August - October 2001)
Vol. 15. Issue 5.
Pages 447-452 (August - October 2001)
Open Access
La distribución binomial negativa frente a la de Poisson en el análisis de fenómenos recurrentes
Negative binomial distribution versus Poisson in the analysis of recurrent phenomena
Visits
12977
A. Navarroa,
Corresponding author
Albert.Navarro@Uab.es

Correspondencia: A. Navarro. Laboratori de Bioestadística i Epidemiología. Facultat de Medicina. UAB. 08193 Cerdanyola del Vallès. Barcelona.
, F. Utzetb, P. Puigb, J. Caminala, M. Martína
a Laboratori de Bioestadística i Epidemiología. Facultad de Medicina. Universitat Autònoma de Barcelona.
b Servei d'Estadística de la Universitat Autònoma de Barcelona.
This item has received

Under a Creative Commons license
Article information
Resumen
Objetivos

Exponer la posible problemática en el cálculo de riesgos en bases de datos agregadas cuando el fenómeno estudiado es recurrente y presentar la distribución binomial negativa como una alternativa válida y sencilla para analizar este tipo de fenómeno.

Métodos

En el contexto de los fenómenos recurrentes, el análisis mediante la regresión de Poisson puede provocar sobredispersión o variancia extra-Poisson. Esto conduce a la subestimación de los errores estándares de los coeficientes, pudiendo derivar en la significación estadística de factores que realmente no estén asociados con el fenómeno. La binomial negativa puede captar parte de la variancia que no identifica la regresión de Poisson. Para comprobarlo se comparó ambas distribuciones sobre el número de hospitalizaciones que presentaron individuos, entre 65 y 69 años de edad, durante el año 1996. Esta comparación fue realizada en dos bases de datos agregadas distintas: por individuo y según las variables de interés.

Resultados

El ajuste mediante ambas distribuciones presenta diferencias en las dos bases de datos. Según el estudio de los residuos, en la base por individuo la binomial negativa ajusta correctamente el 67,9% de las observaciones mal ajustadas por la regresión de Poisson. Este porcentaje es del 50% en la base agregada según las variables. Además, en ambos casos, la regresión de Poisson estima significativas cuatro de las seis variables estudiadas. Para la binomial negativa son dos en la base por individuo y una en la base por variables.

Conclusiones

La existencia de sobredispersión es frecuente en fenómenos recurrentes. Cuando esto sucede, el uso de la binomial negativa es más apropiado que el de la regresión de Poisson.

Palabras clave:
Binomial negativa
Sobredispersión
Extra-Poisson
Episodios recurrentes
Poisson
Summary
Objective

The aim is to unfold the difficulties likely to arise in risk calculations through aggregated database when the studied phenomenon is recurrent and to display the negative binomial distribution as a valid and simple alternative to analyse this kind of phenomenon.

Methods

When the studied phenomenon is recurrent, the analysis by means of the Poisson regression can provoke overdispersion or extra-poisson variance, what leads to underestimating the standard errors in coefficients and may divert into the statistical significance of factors which as a matter of fact are not associated with the phenomenon beforehand. The negative binomial can grasp part of the variance which the Poisson is unable to identify. In order to check this out, the fit of both distributions were compared, based on the number of hospitalizations of individuals aged between 65 and 69, during 1996. This comparison was carried out by means of two different aggregated databases: by individuals and by variables.

Results

There were differences in the fitted models by means of both distributions in both databases. By the analysis of the residuals, when using the base by individuals, the negative binomial fits correctly 67.9% of the observations badly fitted by the Poisson. Using the aggregated variables database, the percentage is 50%. In both cases, Poisson estimates four out of the six studied variables as significant. As to the negative binomial, there are two significant based on individuals and one in the variable database.

Conclusion

The existence of overdispersion is frequent in recurrent-type phenomena. When this occurs, the negative binomial distribution is more appropiate than the Poisson.

Key words:
Negative binomial
Overdispersion
Extra-Poisson
Recurrent events
Poisson
Full text is only aviable in PDF
Biblografía
[1.]
R.G. Cumming, J.L. Kelsey, M.C. Nevitt.
Methodologic issues in the study of frequent and recurrent health problems: falls in the elderly.
Ann Epidemiol, 1 (1990), pp. 49-56
[2.]
J.K. Lindsey.
Counts and times to events.
Statist Med, 17 (1998), pp. 1745-1751
[3.]
J.K. Lindsey.
Models for repeated measuraments.
[4.]
J.F. Lawless.
Negative binomial and mixed Poisson regression.
Can J Stat, 15 (1987), pp. 209-225
[5.]
S.P. Miaou.
The relationship between truck accidents and geometric design of road sections: Poisson versus negative binomial regressions.
Accid Anal Prev, 26 (1994), pp. 471-482
[6.]
W.N. Venables, B.D. Ripley.
Modern applied statistics with S-Plus.
2.ª,
[7.]
R.J. Glynn, T.A. Stukel, S.M. Sharp, T.A. Bubolz, J.L. Freeman, E.S. Fisher.
Estimating the variance of standarized rates of recurrent events, with application to hospitalizations among the elderly in New England.
Am J Epidemiol, 7 (1993), pp. 776-786
[8.]
J.K. Lindsey.
Introductory statistics. A modelling approach.
[9.]
P. McCullagh, J.A. Nelder.
Generalized linear models.
2.ª,
[10.]
S-PLUS 4.5 Professional edition for Windows.
[11.]
J. Caminal.
Las hospitalizaciones por Ambulatory Care Sensitive Consitions: Un indicador de la capacidad de resolución de la atención primaria de salud [Tesis doctoral].
[12.]
Web del Institut d'Estadística de Catalunya. Disponible en: http://www.idescat.es/
[13.]
D.A. Pierce, D.W. Schafer.
Residuals in Generalized Linear Models.
J Am Stat Assoc, 81 (1986), pp. 977-986
[14.]
N.E. Breslow.
Extra-Poisson variation in log-linear models.
Appl Statist, 33 (1984), pp. 38-44
[15.]
D. Clayton.
Some approaches to the analysis of recurrent event data.
Stat Methods Med Res, 3 (1994), pp. 244-262
[16.]
P.J. Diggle, K.Y. Liang, S.L. Zeger.
Analysis of longitudinal data.
[17.]
F.G. Benavides, M. Sáez, M.A. Barceló, C. Serra.
Incapacidad temporal: estrategias de análisis.
Gac Sanit, 13 (1999), pp. 185-190
[18.]
S-Plus 4 Guide to Statistics.
[19.]
P. Kelly, L. Lim.
Survival analysis for recurrent event data: an application to childhood infectious diseases.
Statist Med, 19 (2000), pp. 13-33
Copyright © 2001. Sociedad Española de Salud Pública y Administración Sanitaria
Download PDF
Idiomas
Gaceta Sanitaria
Article options
Tools
es en

¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?

Are you a health professional able to prescribe or dispense drugs?