array:19 [
  "pii" => "13012098"
  "issn" => "02139111"
  "estado" => "S300"
  "fechaPublicacion" => "1999-08-01"
  "documento" => "article"
  "crossmark" => 0
  "licencia" => "http://www.elsevier.com/open-access/userlicense/1.0/"
  "subdocumento" => "fla"
  "cita" => "Gac Sanit. 1999;13 Supl Congr 1:9010"
  "abierto" => array:3 [
    "ES" => true
    "ES2" => true
    "LATM" => true
  ]
  "gratuito" => true
  "lecturas" => array:2 [
    "total" => 1910
    "formatos" => array:3 [
      "EPUB" => 163
      "HTML" => 1597
      "PDF" => 150
    ]
  ]
  "itemSiguiente" => array:16 [
    "pii" => "13012102"
    "issn" => "02139111"
    "estado" => "S300"
    "fechaPublicacion" => "1999-08-01"
    "documento" => "article"
    "crossmark" => 0
    "licencia" => "http://www.elsevier.com/open-access/userlicense/1.0/"
    "subdocumento" => "fla"
    "cita" => "Gac Sanit. 1999;13 Supl Congr 1:9011"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 2454
      "formatos" => array:3 [
        "EPUB" => 157
        "HTML" => 2200
        "PDF" => 97
      ]
    ]
    "es" => array:6 [
      "idiomaDefecto" => true
      "titulo" => "ESTUDIO DE CONDUCTAS SEXUALES DE RIESGO PARA LA TRANSMISIÓN DEL VIH EN HOMBRES HOMO/BISEXUALES DE LA COMUNIDAD DE MADRID"
      "tieneTextoCompleto" => "es"
      "paginas" => array:1 [
        0 => array:1 [
          "paginaInicial" => "9011"
        ]
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => "J Pérez de la Paz, S Cañellas, F Villaamil, M L García Berrocal, I Noguer, J Castilla"
          "autores" => array:6 [
            0 => array:2 [
              "Iniciales" => "J"
              "apellidos" => "Pérez de la Paz"
            ]
            1 => array:2 [
              "Iniciales" => "S"
              "apellidos" => "Cañellas"
            ]
            2 => array:2 [
              "Iniciales" => "F"
              "apellidos" => "Villaamil"
            ]
            3 => array:2 [
              "Iniciales" => "M L"
              "apellidos" => "García Berrocal"
            ]
            4 => array:2 [
              "Iniciales" => "I"
              "apellidos" => "Noguer"
            ]
            5 => array:2 [
              "Iniciales" => "J"
              "apellidos" => "Castilla"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/13012102?idApp=WGSE"
    "url" => "/02139111/0000001300000SC1/v0_201302051654/13012102/v0_201302051654/es/main.assets"
  ]
  "itemAnterior" => array:16 [
    "pii" => "13012101"
    "issn" => "02139111"
    "estado" => "S300"
    "fechaPublicacion" => "1999-08-01"
    "documento" => "article"
    "crossmark" => 0
    "licencia" => "http://www.elsevier.com/open-access/userlicense/1.0/"
    "subdocumento" => "fla"
    "cita" => "Gac Sanit. 1999;13 Supl Congr 1:9009"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 2069
      "formatos" => array:3 [
        "EPUB" => 163
        "HTML" => 1759
        "PDF" => 147
      ]
    ]
    "es" => array:6 [
      "idiomaDefecto" => true
      "titulo" => "RECONSTRUCCIÓN DE LA EPIDEMIA DE VIH Y SIDA EN ESPAÑA"
      "tieneTextoCompleto" => "es"
      "paginas" => array:1 [
        0 => array:1 [
          "paginaInicial" => "9009"
        ]
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => "J Castilla, MJ Belza, S Cañellas, L de la Fuente, F Sánchez, J Pérez de la Paz"
          "autores" => array:6 [
            0 => array:2 [
              "Iniciales" => "J"
              "apellidos" => "Castilla"
            ]
            1 => array:2 [
              "Iniciales" => "MJ"
              "apellidos" => "Belza"
            ]
            2 => array:2 [
              "Iniciales" => "S"
              "apellidos" => "Cañellas"
            ]
            3 => array:2 [
              "Iniciales" => "L"
              "apellidos" => "de la Fuente"
            ]
            4 => array:2 [
              "Iniciales" => "F"
              "apellidos" => "Sánchez"
            ]
            5 => array:2 [
              "Iniciales" => "J"
              "apellidos" => "Pérez de la Paz"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/13012101?idApp=WGSE"
    "url" => "/02139111/0000001300000SC1/v0_201302051654/13012101/v0_201302051654/es/main.assets"
  ]
  "es" => array:7 [
    "idiomaDefecto" => true
    "titulo" => "VALIDEZ DE UN SISTEMA DE REGISTRO NO NOMINAL BASADO EN CODIGOS"
    "tieneTextoCompleto" => true
    "paginas" => array:1 [
      0 => array:1 [
        "paginaInicial" => "9010"
      ]
    ]
    "autores" => array:1 [
      0 => array:2 [
        "autoresLista" => "J Castilla, L de la Fuente, F Sánchez, J Pérez de la Paz, S Cañellas, MJ Belza, I Noguer"
        "autores" => array:7 [
          0 => array:2 [
            "Iniciales" => "J"
            "apellidos" => "Castilla"
          ]
          1 => array:2 [
            "Iniciales" => "L"
            "apellidos" => "de la Fuente"
          ]
          2 => array:2 [
            "Iniciales" => "F"
            "apellidos" => "Sánchez"
          ]
          3 => array:2 [
            "Iniciales" => "J"
            "apellidos" => "Pérez de la Paz"
          ]
          4 => array:2 [
            "Iniciales" => "S"
            "apellidos" => "Cañellas"
          ]
          5 => array:2 [
            "Iniciales" => "MJ"
            "apellidos" => "Belza"
          ]
          6 => array:2 [
            "Iniciales" => "I"
            "apellidos" => "Noguer"
          ]
        ]
      ]
    ]
    "textoCompleto" => "<p class="elsevierStylePara"><span class="elsevierStyleBold">VALIDEZ DE UN SISTEMA DE REGISTRO NO NOMINAL BASADO EN CODIGOS</span></p><p class="elsevierStylePara">J Castilla&#44; L de la Fuente&#44; F S&#225;nchez&#44; J P&#233;rez de la Paz&#44; S Ca&#241;ellas&#44; MJ Belza&#44; I Noguer&#46; Centro Nacional de Epidemiolog&#237;a&#44; Instituto de Salud Carlos III&#59; Secretar&#237;a del Plan Nacional sobre Sida&#46;</p><p class="elsevierStylePara">J Castilla&#44; Centro Nacional de Epidemiolog&#237;a&#46; c&#47; Sinesio Delgado&#44; 6&#46; 28029 Madrid&#46; Tfno&#46;&#58;913877802&#46; Email&#58; jcastill&#64;isciii&#46;es</p><p class="elsevierStylePara">Antecedentes&#58; Ante la creciente sensibilidad social frente al uso de datos nominales en algunos sistemas de informaci&#243;n epidemiol&#243;gica&#44; se ha evaluado la viabilidad y validez de un sistema basado en c&#243;digos&#46;</p><p class="elsevierStylePara">M&#233;todo&#46; Se parti&#243; del Registro Nacional de Sida tras una depuraci&#243;n minuciosa de su contenido&#46; La base de datos conten&#237;a 53&#46;094 registros de personas diferentes con identificadores nominales&#46; Para cada caso se obtuvo un c&#243;digo de trece d&#237;gitos formado por las dos primeras letras del nombre y de cada apellido&#44; el sexo y la fecha de nacimiento completa&#46; En un primer paso se analiz&#243; su capacidad discriminativa&#44; calculando la frecuencia de repeticiones del c&#243;digo completo dentro de la misma base de datos&#46; Tambi&#233;n se cuantificaron las repeticiones utilizando c&#243;digos incompletos por la falta de alguna parte del mismo&#46; Se hicieron estas mismas comprobaciones en bases de datos de diferente n&#250;mero de efectivos obtenidos por selecci&#243;n aleatoria de la base de datos inicial&#46; En un segundo paso se evalu&#243; la sensibilidad y especificidad del c&#243;digo para la detecci&#243;n de duplicados&#44; durante el proceso de incorporaci&#243;n de 1&#46;114 nuevas notificaciones&#46; Se tom&#243; como gold standard el resultado de la detecci&#243;n de duplicados utilizando datos nominales completos&#46; En todo momento se mantuvieron estrictas medidas de seguridad y confidencialidad&#46;</p><p class="elsevierStylePara">Resultados&#58; De los 53&#46;094 casos&#44; en 5 no constaba el sexo&#44; en el 11&#44;4&#37; la fecha de nacimiento y en el 1&#44;5&#37; el segundo apellido &#40;casi todos de origen extranjero&#41;&#46; El c&#243;digo completo con 13 d&#237;gitos se pudo obtener en 46&#46;593 casos&#46; La capacidad discriminativa fue elevada&#44; ya que s&#243;lo en el 0&#44;12&#37; de los casos coincid&#237;a el c&#243;digo completo siendo sujetos distintos&#46; Las coincidencias se elevaron hasta el 2&#44;9&#37; cuando no se incluy&#243; el d&#237;a y mes de nacimiento&#44; al 25&#44;5&#37; si faltaba la fecha de nacimiento completa y al 38&#44;8&#37; si s&#243;lo se inclu&#237;a el sexo y la primera inicial del nombre y de cada apellido&#46; Los porcentajes de falsos coincidentes se redujeron exponencialmente conforme disminuy&#243; el tama&#241;o de la base de datos&#46; Al comparar la base de datos completa con la base de datos con 1&#46;114 nuevas notificaciones utilizando toda la informaci&#243;n disponible&#44; incluidos el nombre y los apellidos completos&#44; se identificaron 121 &#40;10&#44;9&#37;&#41; personas duplicadas&#46; Esta clasificaci&#243;n se consider&#243; como gold standard&#46; Comparando las dos bases de datos con los c&#243;digos completos&#44; hubo 64 casos en los que coincidi&#243; exactamente&#44; y 63 de ellos eran realmente duplicados &#40;sensibilidad&#61;52&#44;1&#37; y especificidad&#61;99&#44;9&#37;&#41;&#46; Todos los duplicados no detectados se debieron a la ausencia de alguna parte del c&#243;digo &#40;87&#37;&#41; o a errores en su contenido &#40;13&#37;&#41;&#46; Utilizando &#250;nicamente las iniciales y el sexo se obtuvo una sensibilidad del 89&#44;3&#37; y una especificidad del 61&#44;7&#37;&#44; y se eliminaron como duplicados 380 casos que en realidad no lo eran&#46;</p><p class="elsevierStylePara">Conclusi&#243;n&#58; El c&#243;digo descrito proporciona buenos resultados siempre que est&#233; totalmente completo y correcto en todos los casos&#44; ya que todas las variables que lo componen aportan capacidad discriminativa&#46; La proporci&#243;n de registros con c&#243;digos incompletos o incorrectos es determinante para la validez global del sistema de informaci&#243;n&#46; La utilizaci&#243;n de c&#243;digos diferentes limita las posibilidades de cruce entre distintas fuentes de informaci&#243;n&#46;</p>"
    "tienePdf" => false
  ]
  "idiomaDefecto" => "es"
  "url" => "/02139111/0000001300000SC1/v0_201302051654/13012098/v0_201302051654/es/main.assets"
  "Apartado" => array:4 [
    "identificador" => "829"
    "tipo" => "SECCION"
    "es" => array:2 [
      "titulo" => "Mesa de comunicaciones&#58; VIH-SIDA"
      "idiomaDefecto" => true
    ]
    "idiomaDefecto" => "es"
  ]
  "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/13012098?idApp=WGSE"
]
Compartir
Publique en esta revista
Información de la revista
Vol. 13. Núm. SC1.
Páginas 9010 (agosto 1999)
Respuestas rápidas
Compartir
Compartir
Más opciones de artículo
Vol. 13. Núm. SC1.
Páginas 9010 (agosto 1999)
Acceso a texto completo
VALIDEZ DE UN SISTEMA DE REGISTRO NO NOMINAL BASADO EN CODIGOS
Visitas
644
J. Castilla, L. de la Fuente, F. Sánchez, J. Pérez de la Paz, S. Cañellas, MJ. Belza, I. Noguer
Este artículo ha recibido
Información del artículo
Texto completo
Estadísticas
Texto completo

VALIDEZ DE UN SISTEMA DE REGISTRO NO NOMINAL BASADO EN CODIGOS

J Castilla, L de la Fuente, F Sánchez, J Pérez de la Paz, S Cañellas, MJ Belza, I Noguer. Centro Nacional de Epidemiología, Instituto de Salud Carlos III; Secretaría del Plan Nacional sobre Sida.

J Castilla, Centro Nacional de Epidemiología. c/ Sinesio Delgado, 6. 28029 Madrid. Tfno.:913877802. Email: jcastill@isciii.es

Antecedentes: Ante la creciente sensibilidad social frente al uso de datos nominales en algunos sistemas de información epidemiológica, se ha evaluado la viabilidad y validez de un sistema basado en códigos.

Método. Se partió del Registro Nacional de Sida tras una depuración minuciosa de su contenido. La base de datos contenía 53.094 registros de personas diferentes con identificadores nominales. Para cada caso se obtuvo un código de trece dígitos formado por las dos primeras letras del nombre y de cada apellido, el sexo y la fecha de nacimiento completa. En un primer paso se analizó su capacidad discriminativa, calculando la frecuencia de repeticiones del código completo dentro de la misma base de datos. También se cuantificaron las repeticiones utilizando códigos incompletos por la falta de alguna parte del mismo. Se hicieron estas mismas comprobaciones en bases de datos de diferente número de efectivos obtenidos por selección aleatoria de la base de datos inicial. En un segundo paso se evaluó la sensibilidad y especificidad del código para la detección de duplicados, durante el proceso de incorporación de 1.114 nuevas notificaciones. Se tomó como gold standard el resultado de la detección de duplicados utilizando datos nominales completos. En todo momento se mantuvieron estrictas medidas de seguridad y confidencialidad.

Resultados: De los 53.094 casos, en 5 no constaba el sexo, en el 11,4% la fecha de nacimiento y en el 1,5% el segundo apellido (casi todos de origen extranjero). El código completo con 13 dígitos se pudo obtener en 46.593 casos. La capacidad discriminativa fue elevada, ya que sólo en el 0,12% de los casos coincidía el código completo siendo sujetos distintos. Las coincidencias se elevaron hasta el 2,9% cuando no se incluyó el día y mes de nacimiento, al 25,5% si faltaba la fecha de nacimiento completa y al 38,8% si sólo se incluía el sexo y la primera inicial del nombre y de cada apellido. Los porcentajes de falsos coincidentes se redujeron exponencialmente conforme disminuyó el tamaño de la base de datos. Al comparar la base de datos completa con la base de datos con 1.114 nuevas notificaciones utilizando toda la información disponible, incluidos el nombre y los apellidos completos, se identificaron 121 (10,9%) personas duplicadas. Esta clasificación se consideró como gold standard. Comparando las dos bases de datos con los códigos completos, hubo 64 casos en los que coincidió exactamente, y 63 de ellos eran realmente duplicados (sensibilidad=52,1% y especificidad=99,9%). Todos los duplicados no detectados se debieron a la ausencia de alguna parte del código (87%) o a errores en su contenido (13%). Utilizando únicamente las iniciales y el sexo se obtuvo una sensibilidad del 89,3% y una especificidad del 61,7%, y se eliminaron como duplicados 380 casos que en realidad no lo eran.

Conclusión: El código descrito proporciona buenos resultados siempre que esté totalmente completo y correcto en todos los casos, ya que todas las variables que lo componen aportan capacidad discriminativa. La proporción de registros con códigos incompletos o incorrectos es determinante para la validez global del sistema de información. La utilización de códigos diferentes limita las posibilidades de cruce entre distintas fuentes de información.

Idiomas
Gaceta Sanitaria
Opciones de artículo
Herramientas
es en

¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?

Are you a health professional able to prescribe or dispense drugs?