La utilización de datos administrativos es práctica habitual en la investigación en salud pública. El objetivo de este trabajo es describir la Muestra continua de vidas laborales (MCVL) y su utilidad en la investigación en salud. La MCVL está construida sobre registros que generan todos los contactos con la Seguridad Social (laborales, incapacidades, etc.), más datos fiscales (percepciones dinerarias, ingresos, etc.) y del padrón (nivel educativo, país de nacimiento, etc.), sin que sea posible la identificación individual. La MCVL se inició en 2004 con el 4% (1,1 millón de personas) del total de población cotizante o perceptora de la Seguridad Social. Los datos de las personas que forman parte de la MCVL son actualizados anualmente, y se sustituyen las bajas producidas. Este diseño continuo permite generar una cohorte con información de la vida laboral y económica, y valorar su asociación con la incapacidad laboral. El supuesto de conexión con la historia clínica posibilitaría el análisis de otros resultados de salud.
The use of administrative data is common practice in public health research. The present field note describes the Continuous Working Life Sample (CWLS) and its use in health research. The CWLS is built on records generated by all contacts with the social security system (work contracts, disability, etc.), plus tax data (monetary gains, income, etc.) and census data (level of education, country of birth, etc.), but does not allow individuals to be identified. The CWLS was started in 2004 with 4% (1.1 million persons) of the total population who were either contributors to or beneficiaries of the social security system. The information on the individuals in the CWLS is updated annually and lost individuals are replaced. This continuous design allows the construction of a cohort with information on working life and financial status and evaluation of their relationship with work disability. Future connection with clinical records would enable analysis of other health-related outcomes.
Desde que John Graunt (1620-1674) y Willian Farr (1807-1883) hicieran uso de los registros de mortalidad en Inglaterra y Gales para cuantificar los principales problemas de salud en su tiempo1, muchos y diversos son los registros administrativos que han mostrado su utilidad para investigar y vigilar diferentes problemas de salud en la población. Un ejemplo clásico del uso de registros administrativos en salud pública lo constituyen los registros británicos2. En algunos estudios, los datos administrativos han sido complementados conectándolos (record linkage) con datos recogidos mediante encuestas o datos clínicos procedentes de la historia clínica2. Actualmente, los registros escandinavos constituyen otro ejemplo de utilización de registros administrativos para realizar estudios epidemiológicos. Entre ellos destaca el basado en conectar el censo poblacional, el registro de calidad de agua y las altas hospitalarias en Finlandia, para determinar la relación entre la concentración de fluoruro en el agua potable y las fracturas de cadera3.
En España, desde 2004 está disponible para los investigadores una base de datos administrativa ofrecida por la Seguridad Social, la Muestra continua de vidas laborales (MCVL), que incluye el 4% de las personas que tienen relación con la Seguridad Social, sea como cotizantes (p. ej., asalariados) o como beneficiarios (pensionistas). La MCVL se ha utilizado principalmente en estudios laborales y económicos, entre ellos los que evalúan las tendencias de entrada a la jubilación y la duración de las relaciones laborales4. Sólo recientemente se ha empezado a utilizar la MCVL en salud pública5,6. El objetivo de esta nota de campo es describir la MCVL y mostrar sus posibles utilidades en la investigación en salud pública.
Muestra continua de vidas laboralesLa MCVL se inició en 2004, desde la Dirección General de Ordenación de la Seguridad Social, con una muestra representativa del 4% de los individuos afiliados en alta a la Seguridad Social en ese año4. Desde entonces, cada año se genera una nueva muestra que, al utilizar los mismos algoritmos, vuelve a seleccionar a los que ya estaban, si siguen en contacto con la Seguridad Social, y en caso de que no lo estén (por desempleo y finalización de su prestación asociada, o por muerte del beneficiario o afiliado) son sustituidos por personas con similares características, que pasarán a formar parte de la MCVL hasta que dejen de estar en contacto con la Seguridad Social. De este modo, la muestra es similar a una muestra tipo panel, donde se recoge información sobre las mismas personas en diferentes olas, lo que permite mantener la representatividad de la muestra y acumular la información que se haya generado en ese año. Por ejemplo, cambios de asalariado a autónomo, o pasar a pensión por incapacidad permanente o por jubilación. Así, puede construirse una cohorte dinámica de individuos que son seguidos mientras estén en contacto con la Seguridad Social. En un seguimiento desde 2004 a 2009, basado en los que son cotizantes del régimen general, el 88% de los que estaban en 2004 fueron seguidos durante todo el período6.
Para cada persona se dispone de datos procedentes de diversos registros administrativos, la mayoría de la Seguridad Social, pero también fiscales y demográficos. En la tabla 1 se resume toda la información disponible para cada persona, como tipos de contrato, con fechas de altas y bajas, grupo de cotización y bajas por incapacidad permanente, lo que se complementa con información de ese año procedente de la Agencia Tributaria y del Padrón continuo.
Variables que se encuentran en los ficheros que conforman la Muestra continua de vidas laborales (MCVL)
Ficheros | Variables | |
Datos personales | ▪ Fecha de nacimiento | ▪ Domicilio |
▪ Sexo | ▪ Fecha de fallecimiento | |
▪ Nacionalidad | ▪ País de nacimientoa | |
▪ Provincia de nacimientoa | ▪ Nivel educativoa | |
▪ Provincia de primera afiliación | ||
Datos de convivientes | ▪ Fecha de nacimiento de convivientesa | ▪ Sexo de convivientesa |
Datos afiliados | ▪ Régimen de cotización | ▪ Tipo de relación laboral |
▪ Grupo de cotización | ▪ Colectivo del trabajador | |
▪ Tipo de contrato | ▪ Tipo de empleador y de entidad | |
▪ Coeficiente de tiempo parcial | ▪ Domicilio social: provincia | |
▪ Fechas reales de alta y de baja | ▪ Fecha de modificación de contrato | |
▪ Causa de la baja | ▪ Tipo de contrato hasta la modificación | |
▪ Minusvalía según alta de afiliación | ▪ Coeficiente de tiempo parcial hasta la modificación | |
▪ Actividad económica de la cuenta de cotización (CNAE 2009) | ▪ Fecha de modificación de grupo de cotización | |
▪ Número de trabajadores en la cuenta de cotización | ▪ Grupo de cotización hasta la modificación | |
▪ Fecha de alta del primer trabajador | ▪ Actividad económica, clasificación antigua (C93C) | |
Bases de cotización | ▪ Identificación de la cuenta de cotización (secundaria) | ▪ Año de cotización |
▪ Fechas reales de alta y de baja | ▪ Base de cotización mensual cuenta ajena por contingencias comunes | |
▪ Fechas de efecto del alta y de la baja | ▪ Base de cotización cuenta propia y otros | |
▪ Grupo de cotización | ▪ Total base de cotización del año | |
Datos prestaciones | ▪ Año del dato | ▪ Situación de la prestación (causa baja) |
▪ Clase de la prestación | ▪ Fecha de situación de la prestación | |
▪ Situación del sujeto causante | ▪ Provincia de gestión de la prestación | |
▪ Grado de incapacidad | ▪ Número de titulares de un mismo sujeto causante | |
▪ Fecha de minusvalía | ▪ Prorrata de convenio internacional | |
▪ Norma SOVI | ▪ Prorrata de divorcio | |
▪ Clase de mínimo | ▪ Coeficiente reductor total | |
▪ Régimen de la pensión | ▪ Tipo de situación de jubilación | |
▪ Fecha de efectos económicos de la pensión | ▪ Coeficiente de parcialidad (jubilación) | |
▪ Base reguladora | ▪ Prestación vitalicia (orfandad) | |
▪ Porcentaje aplicado a la base reguladora | ▪ Concurrencia con prestación ajena | |
▪ Años bonificados | ▪ Importe anual pagas extra | |
▪ Años considerados cotizados para la jubilación | ▪ Importe anual paga desviación IPC | |
▪ Importe mensual de la pensión efectiva | ▪ Importe anual total de la prestación | |
▪ Importe mensual de revalorización | ▪ Año de nacimiento del causante de pensión de supervivencia | |
▪ Importe mensual de complementos garantía mínimos | ▪ Pensión limitada | |
▪ Importe mensual de otros complementos | ▪ Importe mensual total de la prestación | |
Datos fiscales | ▪ Identificador anonimizado de la entidad pagadora | ▪ Situación familiar |
▪ Provincia | ▪ Discapacidad | |
▪ Clave de percepción | ▪ Tipo de contrato o relación | |
▪ Subclave | ▪ Prolongación actividad laboral | |
▪ Percepción íntegra (dineraria) | ▪ Movilidad geográfica | |
▪ Retenciones practicadas | ▪ Reducciones | |
▪ Percepciones en especie (valoración) | ▪ Gastos deducibles | |
▪ Ingresos a cuenta efectuados | ▪ Pensiones compensatorias | |
▪ Ingresos a cuenta repercutidos | ▪ Anualidades por alimentos | |
▪ Ceuta o Melilla | ▪ Número de descendientes | |
▪ Ejercicio de nacimiento | ▪ Número de ascendentes |
IPC: índice de precios al consumo.
La riqueza de datos hace de la MCVL una herramienta útil en varios ámbitos de investigación en salud pública. Por un lado, permite reconstruir la trayectoria laboral de cada persona desde su primer contrato hasta su jubilación, identificando en estas personas la fecha de inicio y finalización de cada contrato, junto con el tipo de éste, su base salarial y de cotización, la actividad económica de la empresa, o los períodos en que recibe la prestación por de-sempleo (alguno de estos datos pueden conseguirse desde 1980). Asimismo, se añade la fecha de inicio de una prestación por incapacidad permanente por enfermedad o accidente, con su grado de incapacidad6. Además, si el cotizante o beneficiario incluido en la MCVL está afiliado en el momento de su muerte, el registro informa también de la fecha de defunción.
La principal ventaja de la MCVL es que está basada en registros administrativos, lo que representa un reducido coste en comparación con el coste de estudios con datos primarios, en especial si son de seguimiento7. También, en comparación con los autorreportados, los datos de la MCVL son fiables respecto a ítems como la situación laboral, el salario, la edad de jubilación o el grado de incapacidad permanente. Además, debemos señalar como tercera ventaja su gran tamaño muestral7 (alrededor de un millón de personas) y su representatividad de la población de referencia, que se mantiene desde 2004 (ver tabla 2), y ya está disponible la edición de 20128.
Características de los individuos de la Muestra continua de vidas laborales (MCVL) correspondiente a 2004
Características de todos los incluidos en la MCVL (n = 1.089.490) | n (%) | n (%) | |
Sexo | Actividad económicae | ||
Mujeres | 617.737 (56,7) | Agricultura, ganadería, pesca e industrias extractivas | 26.856 (2,6) |
Hombres | 471.753 (43,3) | Industria manufacturera | 95.446 (9,2) |
Edad (años)a | Producción y distribución de energía | 3.483 (0,3) | |
<30 | 203.585 (18,7) | Construcción | 81.723 (7,9) |
31-45 | 363.942 (33,4) | Comercio | 103.814 (10,0) |
46-60 | 230.125 (21,1) | Hostelería, transporte y telecomunicaciones | 77.809 (7,5) |
>60 | 291.833 (26,8) | Intermediación financiera | 15.526 (1,5) |
Actividades inmobiliarias | 87.762 (8,5) | ||
Comunidad autónomab | Administración pública | 200.439 (19,4) | |
Andalucía | 173.673 (15,9) | Educación, actividades sanitarias y servicios a la comunidad | 85.069 (8,2) |
Aragón | 26.521 (2,4) | Actividades en los hogares | 9.435 (0,9) |
Asturias | 22.470 (2,1) | Organizaciones extraterritoriales | 127 (0,012) |
Cantabria | 12.248 (1,1) | Clase social ocupacional según grupo de cotización del régimen generalf | |
Castilla-La Mancha | 34.571 (3,2) | Cualificados no manuales | 108.731 (15,5) |
Castilla y León | 50.969 (4,7) | Cualificados manuales | 234.079 (33,4) |
Cataluña | 157.100 (14,4) | No cualificados no manuales | 219.902 (31,4) |
Ceuta y Melilla | 2.011 (0,2) | No cualificados manuales | 137.822 (19,7) |
Comunidad Valenciana | 97.480 (9,0) | ||
Extremadura | 20.887 (1,9) | ||
Galicia | 58.340 (5,4) | ||
Islas Baleares | 19.603 (1,8) | ||
Islas Canarias | 37.716 (3,5) | ||
La Rioja | 6.302 (0,6) | ||
Madrid | 127.631 (11,7) | ||
Murcia | 26.275 (2,4) | ||
Navarra | 12.841 (1,2) | ||
País Vasco | 47.767 (4,4) | ||
Relación con la Seguridad Social | |||
Cotizantesc | |||
Régimen general | 796.924 (77,0) | ||
Régimen autónomos y especiales | 237.451 (23,0) | ||
Beneficiariosd | |||
Jubilación | 176.186 (57,7) | ||
Viudedad, orfandad y otros | 94.054 (26,1) | ||
Incapacidad | 35.261 (11,5) |
Desde el punto de vista de salud pública, la principal limitación es que la MCVL apenas incluye datos de salud, exceptuando el tipo de contingencia para la incapacidad permanente (contingencia común o profesional). Tampoco las defunciones cuentan con su causa básica. Una segunda limitación es que en la MCVL encontramos sólo datos sobre personas que están cubiertas por la Seguridad Social, y por lo tanto quedan fuera los cotizantes a otros sistemas de previsión, como MUFACE (funcionarios), ISFA (militares) y MUGEJU (administración de justicia), si bien estos sistemas están en proceso de convergencia hacia el Sistema General de Seguridad Social4. Tampoco se tiene información de las personas que trabajan en la economía sumergida, y por tanto sin cobertura de la seguridad social.
Perspectivas de futuroLa MCVL representa una oportunidad singular para el futuro de la investigación en salud pública en España. Por ejemplo, desde el Programa de investigación de evaluación de programas sanitarios del CIBER de Epidemiología y Salud Pública (www.ciberesp.es) se ha iniciado un estudio de carga de la enfermedad por incapacidad laboral basado en la MCVL.
Algunas experiencias previas han avanzado en esta dirección. Por ejemplo, recientemente se han incorporado a la MCVL de 2009 los datos de incapacidad temporal con el diagnóstico médico al alta, y su fecha de inicio y finalización, que permiten identificar si esos episodios se han producido en la misma persona9. Estos datos están facilitando analizar la incidencia de la incapacidad temporal, infrecuente en la literatura y muy útil, ya que existe la posibilidad de estimar con precisión los tiempos que cada persona ha estado en riesgo de poder padecer una incapacidad temporal, permitiendo descontar los períodos en que no está activo en una empresa y con el régimen que le cubre esa contingencia. De esta forma, la incidencia de la incapacidad temporal puede estimarse mediante una tasa, a diferencia de estudios que únicamente han podido utilizar la incidencia acumulada10. La repetición de esta conexión entre la MCVL y los datos de incapacidad temporal permitiría analizar trayectorias de incapacidad temporal y su asociación con la incapacidad permanente.
Finalmente, otra potencialidad es la de conectar la MCVL con información de algunos registros sanitarios, manteniendo la protección de la identidad de las personas que forman parte de la muestra, como ocurre ahora, y tras la supervisión de los respectivos comités de ética.
Editor responsable del artículoAlberto Ruano-Ravina.
Contribuciones de autoríaF.G. Benavides concibió la idea principal de dar a conocer a la comunidad científica el uso de la Muestra continua de vidas laborales en estudios de salud pública. La propuesta del manuscrito original la realizaron M.A. López y F.G. Benavides. Las tablas descriptivas de la muestra las elaboró M.A. López con la contribución de F.G. Benavides, J. Alonso, X. Durán y J.M. Martínez. Todos los autores hasta ahora mencionados, con la contribución de M. Espallargues, realizaron una revisión crítica del manuscrito y aportaron contribuciones intelectuales al contenido de la nota. Todos los autores aprobaron la versión final para su publicación.
FinanciaciónNinguna.
Conflictos de interesesNinguno.