array:24 [
  "pii" => "S0213911115002046"
  "issn" => "02139111"
  "doi" => "10.1016/j.gaceta.2015.09.007"
  "estado" => "S300"
  "fechaPublicacion" => "2016-01-01"
  "aid" => "1186"
  "copyright" => "SESPAS"
  "copyrightAnyo" => "2015"
  "documento" => "article"
  "crossmark" => 1
  "licencia" => "http://creativecommons.org/licenses/by-nc-nd/4.0/"
  "subdocumento" => "sco"
  "cita" => "Gac Sanit. 2016;30:66-8"
  "abierto" => array:3 [
    "ES" => true
    "ES2" => true
    "LATM" => true
  ]
  "gratuito" => true
  "lecturas" => array:2 [
    "total" => 15406
    "formatos" => array:3 [
      "EPUB" => 247
      "HTML" => 13490
      "PDF" => 1669
    ]
  ]
  "itemSiguiente" => array:19 [
    "pii" => "S0213911115002137"
    "issn" => "02139111"
    "doi" => "10.1016/j.gaceta.2015.10.009"
    "estado" => "S300"
    "fechaPublicacion" => "2016-01-01"
    "aid" => "1193"
    "copyright" => "SESPAS"
    "documento" => "simple-article"
    "crossmark" => 1
    "licencia" => "http://creativecommons.org/licenses/by-nc-nd/4.0/"
    "subdocumento" => "crp"
    "cita" => "Gac Sanit. 2016;30:69-72"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 4161
      "formatos" => array:3 [
        "EPUB" => 238
        "HTML" => 2594
        "PDF" => 1329
      ]
    ]
    "es" => array:13 [
      "idiomaDefecto" => true
      "cabecera" => "<span class="elsevierStyleTextfn">Nota de campo</span>"
      "titulo" => "Optimizaci&#243;n de la informaci&#243;n sobre la medicaci&#243;n de personas polimedicadas en atenci&#243;n primaria"
      "tienePdf" => "es"
      "tieneTextoCompleto" => "es"
      "tieneResumen" => array:2 [
        0 => "es"
        1 => "en"
      ]
      "paginas" => array:1 [
        0 => array:2 [
          "paginaInicial" => "69"
          "paginaFinal" => "72"
        ]
      ]
      "titulosAlternativos" => array:1 [
        "en" => array:1 [
          "titulo" => "Optimization of information on the medication of polypharmacy patients in primary care"
        ]
      ]
      "contieneResumen" => array:2 [
        "es" => true
        "en" => true
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "contienePdf" => array:1 [
        "es" => true
      ]
      "resumenGrafico" => array:2 [
        "original" => 0
        "multimedia" => array:7 [
          "identificador" => "fig0005"
          "etiqueta" => "Figura 1"
          "tipo" => "MULTIMEDIAFIGURA"
          "mostrarFloat" => true
          "mostrarDisplay" => false
          "figura" => array:1 [
            0 => array:4 [
              "imagen" => "gr1.jpeg"
              "Alto" => 1840
              "Ancho" => 2532
              "Tamanyo" => 278607
            ]
          ]
          "descripcion" => array:1 [
            "es" => "<p id="spar0015" class="elsevierStyleSimplePara elsevierViewall">Ejemplo de la informaci&#243;n proporcionada a los&#47;las m&#233;dicos&#47;as de atenci&#243;n primaria sobre la medicaci&#243;n de los&#47;las pacientes polimedicados&#47;as&#46;</p>"
          ]
        ]
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => "Mar&#237;a Luisa Nicieza-Garc&#237;a, Mar&#237;a Esther Salgueiro-V&#225;zquez, Francisco Jos&#233; Jimeno-Demuth, Gloria Manso"
          "autores" => array:4 [
            0 => array:2 [
              "nombre" => "Mar&#237;a Luisa"
              "apellidos" => "Nicieza-Garc&#237;a"
            ]
            1 => array:2 [
              "nombre" => "Mar&#237;a Esther"
              "apellidos" => "Salgueiro-V&#225;zquez"
            ]
            2 => array:2 [
              "nombre" => "Francisco Jos&#233;"
              "apellidos" => "Jimeno-Demuth"
            ]
            3 => array:2 [
              "nombre" => "Gloria"
              "apellidos" => "Manso"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S0213911115002137?idApp=WGSE"
    "url" => "/02139111/0000003000000001/v2_201603031726/S0213911115002137/v2_201603031726/es/main.assets"
  ]
  "itemAnterior" => array:19 [
    "pii" => "S0213911115002095"
    "issn" => "02139111"
    "doi" => "10.1016/j.gaceta.2015.10.005"
    "estado" => "S300"
    "fechaPublicacion" => "2016-01-01"
    "aid" => "1189"
    "copyright" => "SESPAS"
    "documento" => "article"
    "crossmark" => 1
    "licencia" => "http://creativecommons.org/licenses/by-nc-nd/4.0/"
    "subdocumento" => "sco"
    "cita" => "Gac Sanit. 2016;30:63-5"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 9791
      "formatos" => array:3 [
        "EPUB" => 243
        "HTML" => 7609
        "PDF" => 1939
      ]
    ]
    "es" => array:10 [
      "idiomaDefecto" => true
      "cabecera" => "<span class="elsevierStyleTextfn">Debate</span>"
      "titulo" => "<span class="elsevierStyleItalic">Big data</span> en sanidad en Espa&#241;a&#58; la oportunidad de una estrategia nacional"
      "tienePdf" => "es"
      "tieneTextoCompleto" => "es"
      "paginas" => array:1 [
        0 => array:2 [
          "paginaInicial" => "63"
          "paginaFinal" => "65"
        ]
      ]
      "titulosAlternativos" => array:1 [
        "en" => array:1 [
          "titulo" => "Big data in health in Spain&#58; now is the time for a national strategy"
        ]
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "contienePdf" => array:1 [
        "es" => true
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => "Carlos Luis Parra Calder&#243;n"
          "autores" => array:1 [
            0 => array:2 [
              "nombre" => "Carlos Luis"
              "apellidos" => "Parra Calder&#243;n"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S0213911115002095?idApp=WGSE"
    "url" => "/02139111/0000003000000001/v2_201603031726/S0213911115002095/v2_201603031726/es/main.assets"
  ]
  "es" => array:14 [
    "idiomaDefecto" => true
    "cabecera" => "<span class="elsevierStyleTextfn">Debate</span>"
    "titulo" => "Peligros del uso de los <span class="elsevierStyleItalic">big data</span> en la investigaci&#243;n en salud p&#250;blica y en epidemiolog&#237;a"
    "tieneTextoCompleto" => true
    "paginas" => array:1 [
      0 => array:2 [
        "paginaInicial" => "66"
        "paginaFinal" => "68"
      ]
    ]
    "autores" => array:1 [
      0 => array:3 [
        "autoresLista" => "Gl&#242;ria P&#233;rez"
        "autores" => array:1 [
          0 => array:3 [
            "nombre" => "Gl&#242;ria"
            "apellidos" => "P&#233;rez"
            "email" => array:1 [
              0 => "gperez&#64;aspb&#46;cat"
            ]
          ]
        ]
        "afiliaciones" => array:1 [
          0 => array:2 [
            "entidad" => "Ag&#232;ncia de Salut P&#250;blica de Barcelona&#44; Barcelona&#44; Espa&#241;a"
            "identificador" => "aff0005"
          ]
        ]
      ]
    ]
    "titulosAlternativos" => array:1 [
      "en" => array:1 [
        "titulo" => "Risks of the use of big data in research in public health and epidemiology"
      ]
    ]
    "textoCompleto" => "<span class="elsevierStyleSections"><p id="par0005" class="elsevierStylePara elsevierViewall"><span class="elsevierStyleDisplayedQuote" id="dsq0005"><p id="spar0005" class="elsevierStyleSimplePara elsevierViewall"><span class="elsevierStyleItalic">Even John Snow needed to start with a plausible hypothesis to know where to look and choose what data to examine</span><a class="elsevierStyleCrossRef" href="#bib0085"><span class="elsevierStyleSup">1</span></a>&#46;</p></span></p><p id="par0010" class="elsevierStylePara elsevierViewall">La realidad incuestionable es la aparici&#243;n de los <span class="elsevierStyleItalic">big data</span> &#40;datos masivos&#41;&#46; Este t&#233;rmino se refiere a los grandes vol&#250;menes de informaci&#243;n compleja y conectable que crece continuamente&#44; de modo que la informaci&#243;n parece duplicarse cada 2 a&#241;os&#44; y este fen&#243;meno podr&#237;a estarse acelerando&#46; En este sentido&#44; cabe destacar que mucha de esta informaci&#243;n era inaccesible hace solo una d&#233;cada&#46;</p><p id="par0015" class="elsevierStylePara elsevierViewall">Los datos masivos proceden de m&#250;ltiples fuentes de informaci&#243;n&#44; derivados de diferentes contextos&#44; tales como los financieros&#44; la inform&#225;tica de negocio&#44; el ocio&#44; las redes sociales y las redes laborales&#44; las ciencias ambientales y tambi&#233;n la salud&#46; En este &#250;ltimo &#225;mbito existen m&#250;ltiples fuentes de informaci&#243;n derivadas de la medicina asistencial&#44; la gen&#243;mica&#44; la biolog&#237;a molecular&#44; la cl&#237;nica&#44; la epidemiolog&#237;a y la salud p&#250;blica&#44; entre otras&#46;</p><p id="par0020" class="elsevierStylePara elsevierViewall">La investigaci&#243;n en salud p&#250;blica y en epidemiolog&#237;a tiene por objetivo conocer la salud de la poblaci&#243;n y sus determinantes<a class="elsevierStyleCrossRef" href="#bib0090"><span class="elsevierStyleSup">2</span></a>&#46; Los posibles beneficios de los <span class="elsevierStyleItalic">big data</span> en la investigaci&#243;n en este campo son el uso de diversas fuentes de informaci&#243;n y la rapidez en el an&#225;lisis<a class="elsevierStyleCrossRef" href="#bib0095"><span class="elsevierStyleSup">3</span></a>&#46; Estas dos caracter&#237;sticas&#44; seg&#250;n algunas opiniones&#44; podr&#237;an dejar el m&#233;todo cient&#237;fico actual obsoleto<a class="elsevierStyleCrossRef" href="#bib0100"><span class="elsevierStyleSup">4</span></a>&#46; No comparto esta &#250;ltima opini&#243;n&#46; Parece que nos volvemos a enfrentar al mismo problema que hace tres d&#233;cadas con la llegada de los ordenadores personales&#44; cuando se cre&#237;a que la velocidad de an&#225;lisis iba a cambiar el m&#233;todo cient&#237;fico en la investigaci&#243;n epidemiol&#243;gica&#46; Es por ello que centrar&#233; mi contribuci&#243;n a este debate en se&#241;alar los &#171;peligros&#187; del uso de los <span class="elsevierStyleItalic">big data</span> en la investigaci&#243;n en salud p&#250;blica y en epidemiolog&#237;a&#46;</p><span id="sec0005" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0005">La necesidad de hip&#243;tesis</span><p id="par0025" class="elsevierStylePara elsevierViewall">Disponer de datos es una de las bases para el progreso cient&#237;fico&#46; En investigaci&#243;n usamos modelos&#44; a veces complejos&#44; como una forma de aproximaci&#243;n a la realidad&#46; Estos modelos de an&#225;lisis de datos se sustentan en hip&#243;tesis y en marcos conceptuales&#44; sin los cuales ser&#237;a imposible realizar investigaci&#243;n&#46; Aunque parece claro que las hip&#243;tesis han de guiar la investigaci&#243;n cualquiera que sea el volumen de datos&#44; existen diversas posiciones al respecto&#46; Por un lado&#44; est&#225;n las personas que creen que los datos nos dir&#225;n aquello que queremos saber&#46; Esta posici&#243;n es muy cercana al &#171;ir de pesca&#187; en los datos&#44; adjudic&#225;ndoles un cierto &#171;buenismo&#187; debido a que el gran tama&#241;o nos permitir&#225; realizar inferencias estad&#237;sticas fiables<a class="elsevierStyleCrossRef" href="#bib0100"><span class="elsevierStyleSup">4</span></a>&#46; En el otro extremo se situar&#237;an aquellas personas que creen que analizar los <span class="elsevierStyleItalic">big data</span> es analizar terabytes de ruido para obtener un megabyte de se&#241;al&#44; y por tanto usar&#237;an los <span class="elsevierStyleItalic">big data</span> en modelos causales m&#225;s o menos simples que se prueban en entornos muy controlados&#46;</p><p id="par0030" class="elsevierStylePara elsevierViewall">Estas dos posiciones est&#225;n explicadas de una forma un tanto simplista&#44; pero describen las dificultades con que nos enfrentamos las personas que nos dedicamos a la investigaci&#243;n&#44; sin que por el momento tengamos una comprensi&#243;n demasiado s&#243;lida de c&#243;mo abordar de manera sistem&#225;tica y eficiente lo que suponen los <span class="elsevierStyleItalic">big data</span> en la investigaci&#243;n en salud p&#250;blica y en epidemiolog&#237;a<a class="elsevierStyleCrossRef" href="#bib0105"><span class="elsevierStyleSup">5</span></a>&#46;</p></span><span id="sec0010" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0010">El origen de los <span class="elsevierStyleItalic">big data</span> y sus posibles sesgos</span><p id="par0035" class="elsevierStylePara elsevierViewall">Los datos &#250;tiles para la investigaci&#243;n en salud p&#250;blica y en epidemiolog&#237;a proceden habitualmente de fuentes dise&#241;adas ad hoc para la investigaci&#243;n o bien de fuentes secundarias&#44; como las historias cl&#237;nicas&#44; pruebas de laboratorio&#44; censo de poblaci&#243;n&#44; registros de enfermedades&#44; etc&#46; Lo que distinguir&#237;a al entorno <span class="elsevierStyleItalic">big data</span> es&#44; por un lado&#44; la incorporaci&#243;n de otras fuentes de informaci&#243;n&#44; como las derivados de los servicios prestados por las App de e-salud&#44; <span class="elsevierStyleItalic">wereables</span>&#44; las redes sociales o las plataformas &#171;nube&#187;&#44; entre otras&#44; y la posibilidad de realizar la consulta a m&#250;ltiples fuentes de datos <span class="elsevierStyleItalic">online</span><a class="elsevierStyleCrossRef" href="#bib0100"><span class="elsevierStyleSup">4</span></a>&#46;</p><p id="par0040" class="elsevierStylePara elsevierViewall">Hay que se&#241;alar que los datos que se obtienen de estas plataformas son muestras de conveniencia y pueden tener un n&#250;mero importante de sesgos de selecci&#243;n y de informaci&#243;n&#44; de los cuales no nos protege el tama&#241;o de los datos&#46; Un ejemplo de sesgo de informaci&#243;n podr&#237;a ser el uso de los Twitterbots&#44; programas usados para producir mensajes automatizados que permiten&#44; mediante el acceso a potenciales clientes&#44; mejorar el posicionamiento de una empresa&#46; Al contrario&#44; puede surgir un sinn&#250;mero de asociaciones&#44; algunas de ellas debidas al azar y a la existencia de sesgos como el de confusi&#243;n&#46; Tambi&#233;n&#44; las empresas de estas plataformas mejoran los servicios a los usuarios constantemente&#44; lo cual podr&#237;a afectar a la comparabilidad de los datos a lo largo del tiempo&#46; Tampoco es f&#225;cil obtener datos y replicar los resultados de los estudios para poder determinar su robustez&#46;</p></span><span id="sec0015" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0015">El an&#225;lisis de los datos</span><p id="par0045" class="elsevierStylePara elsevierViewall">La&#160;miner&#237;a de datos&#160;es la exploraci&#243;n autom&#225;tica o semiautom&#225;tica de los grandes conjuntos de datos con la intenci&#243;n de descubrir patrones&#46; Es uno de los pasos que componen el proceso del <span class="elsevierStyleItalic">knowledge discovery in databases</span><a class="elsevierStyleCrossRef" href="#bib0110"><span class="elsevierStyleSup">6</span></a>&#44; en el cual se incluyen la recolecci&#243;n y la preparaci&#243;n de los datos&#44; la interpretaci&#243;n de los resultados y la informaci&#243;n de estos&#46; Sin embargo&#44; la miner&#237;a de datos genera ciertos desaf&#237;os para la ciencia actual<a class="elsevierStyleCrossRef" href="#bib0115"><span class="elsevierStyleSup">7</span></a>&#46; El primero&#44; como ya se ha mencionado&#44; es la b&#250;squeda de patrones en los <span class="elsevierStyleItalic">big data&#46;</span> Para ilustrarlo&#44; Shiffrin<span class="elsevierStyleSup">7</span> pone un ejemplo&#58; &#171;Supongamos una base de datos de un terabyte de datos con la posibilidad de contener mil factores medibles&#46; El n&#250;mero de posibles correlaciones de esos factores ser&#237;a del orden de dos por mil&#187;&#46; Y el segundo es la posibilidad de asociaciones espurias&#44; que Shiffrin<a class="elsevierStyleCrossRef" href="#bib0115"><span class="elsevierStyleSup">7</span></a> expone claramente&#58; &#171;En una base de terabytes de datos&#44; el factor A se correlaciona con el factor B&#44; y esta podr&#237;a ser una relaci&#243;n causal directa entre ambos factores&#59; sin embargo&#44; tambi&#233;n podr&#237;a haber unos 10<span class="elsevierStyleSup">310</span> otros potenciales bucles causales y las distribuciones de probabilidad asignadas a las 10<span class="elsevierStyleSup">310</span> posibilidades&#187;&#46;</p><p id="par0050" class="elsevierStylePara elsevierViewall">La tecnolog&#237;a permite y permitir&#225; analizar un ingente volumen de datos y establecer innumerables asociaciones mediante modelos complejos&#46; Habr&#225; que desarrollar nuevas propuestas que traten los niveles de significaci&#243;n estad&#237;stica de forma diferente&#44; tal como se hizo evidente al tener que desarrollar los <span class="elsevierStyleItalic">Manhattan plot</span><a class="elsevierStyleCrossRef" href="#bib0120"><span class="elsevierStyleSup">8</span></a> para los estudios de epidemiolog&#237;a gen&#233;tica&#46; Sin embargo&#44; la mayor complejidad de las herramientas anal&#237;ticas podr&#237;a tener como consecuencia posibles limitaciones en la transparencia de los m&#233;todos y en la interpretaci&#243;n y la replicabilidad de los resultados<a class="elsevierStyleCrossRef" href="#bib0125"><span class="elsevierStyleSup">9</span></a>&#46;</p><p id="par0055" class="elsevierStylePara elsevierViewall">Todo ello nos lleva a recordar los criterios de causalidad de Bradford Hill&#44; en los que la fuerza de asociaci&#243;n estad&#237;stica es solo una de las nueve condiciones para establecer la causalidad<a class="elsevierStyleCrossRef" href="#bib0130"><span class="elsevierStyleSup">10</span></a>&#46;</p></span><span id="sec0020" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0020">La generaci&#243;n de conocimiento y su transferencia</span><p id="par0060" class="elsevierStylePara elsevierViewall">La generaci&#243;n de conocimiento es un proceso din&#225;mico de s&#237;ntesis&#44; interpretaci&#243;n&#44; integraci&#243;n y difusi&#243;n de los resultados de la investigaci&#243;n<a class="elsevierStyleCrossRef" href="#bib0135"><span class="elsevierStyleSup">11</span></a>&#46; Es indudable que Internet ha permitido la mejora del trabajo de campo de las encuestas&#44; la recogida de datos y los procesos de compartir datos y de intercambio del conocimiento<a class="elsevierStyleCrossRef" href="#bib0140"><span class="elsevierStyleSup">12</span></a>&#44; como ya est&#225; ocurriendo en algunas redes internacionales &#40;por ejemplo&#44; la de la malaria<a class="elsevierStyleCrossRef" href="#bib0145"><span class="elsevierStyleSup">13</span></a> y la de demograf&#237;a<a class="elsevierStyleCrossRef" href="#bib0150"><span class="elsevierStyleSup">14</span></a>&#41;&#46;</p><p id="par0065" class="elsevierStylePara elsevierViewall">Sin embargo&#44; existen otros &#225;mbitos&#44; como son las predicciones de alertas con consecuencias para la salud de la poblaci&#243;n&#44; en los cuales&#44; aunque se ha demostrado el alto valor alcanzado&#44; a&#250;n se est&#225; lejos de poder suplantar a los m&#233;todos m&#225;s tradicionales<a class="elsevierStyleCrossRef" href="#bib0155"><span class="elsevierStyleSup">15</span></a>&#46;</p><p id="par0070" class="elsevierStylePara elsevierViewall">Tampoco puede desecharse la posibilidad de la manipulaci&#243;n por parte de empresas con &#225;nimo de lucro&#44; o bien desde visiones corporativas que muy l&#237;citamente para sus intereses pretenden influir mediante los <span class="elsevierStyleItalic">big data</span> en las decisiones sobre la salud de la poblaci&#243;n&#44; sin obviar que puedan tener una mayor capacidad de transferencia que las instituciones p&#250;blicas encargadas de la salud p&#250;blica&#46;</p><p id="par0075" class="elsevierStylePara elsevierViewall">Un aspecto no desde&#241;able es poder refutar o aceptar resultados de estudios basados en los <span class="elsevierStyleItalic">big data</span>&#46; No obstante&#44; requerir&#225; que el estudio est&#233; bien sustentado metodol&#243;gicamente&#44; sea cual sea el origen de los datos&#46;</p></span><span id="sec0025" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0025">Aspectos sociales&#44; &#233;ticos y pol&#237;ticos de la investigaci&#243;n con <span class="elsevierStyleItalic">big data</span></span><p id="par0080" class="elsevierStylePara elsevierViewall">La regulaci&#243;n europea prev&#233; la protecci&#243;n de los datos personales&#44; entre los que se encuentran los de la salud de la ciudadan&#237;a<a class="elsevierStyleCrossRef" href="#bib0160"><span class="elsevierStyleSup">16</span></a>&#46; Sin embargo&#44; existen pa&#237;ses donde la normativa puede ser m&#225;s laxa o inexistente&#44; y donde obtener estos datos puede ser m&#225;s f&#225;cil&#46; Por otro lado&#44; la dependencia econ&#243;mica de los pa&#237;ses de renta baja imposibilita que ejerzan la soberan&#237;a sobre sus datos frente a los pa&#237;ses de renta alta&#46; A lo anterior cabr&#237;a a&#241;adir que en la mayor&#237;a de los casos es dif&#237;cil que los resultados de las investigaciones reviertan en la poblaci&#243;n que los ha originado&#44; debido a la inestabilidad pol&#237;tica&#44; la corrupci&#243;n&#44; la pobreza y la precariedad de los sistemas de salud y del acceso a las nuevas tecnolog&#237;as&#46; Los avances cient&#237;ficos que se deriven de esas investigaciones deber&#237;an mejorar la salud y los determinantes de la salud de la poblaci&#243;n en esos pa&#237;ses&#46;</p></span><span id="sec0030" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0030">Conclusiones y recomendaciones</span><p id="par0085" class="elsevierStylePara elsevierViewall">Se concluye que las buenas pr&#225;cticas en la investigaci&#243;n en salud p&#250;blica y en epidemiolog&#237;a no han de ser diferentes para las investigaciones que usen <span class="elsevierStyleItalic">big data&#46;</span> Por tanto&#44; la divisi&#243;n entre la investigaci&#243;n con <span class="elsevierStyleItalic">big data</span> y la investigaci&#243;n tradicional no parece pertinente&#46;</p><p id="par0090" class="elsevierStylePara elsevierViewall">Los investigadores e investigadoras de la salud p&#250;blica y la epidemiolog&#237;a deber&#237;an desempe&#241;ar un papel central en la propuesta de hip&#243;tesis innovadoras&#44; en la construcci&#243;n de infraestructuras para el almacenamiento de grandes conjuntos de datos y en asegurar el desarrollo de enfoques sistem&#225;ticos en el an&#225;lisis de grandes conjuntos de datos complejos y masivos&#46; Para ello&#44; las sociedades cient&#237;ficas relacionadas con la salud p&#250;blica y la epidemiolog&#237;a deber&#237;an proponer una estrategia formativa y abrir un debate necesario en nuestro colectivo&#46;</p></span><span id="sec0035" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0035">Contribuciones de autor&#237;a</span><p id="par0115" class="elsevierStylePara elsevierViewall">Autora &#250;nica&#46;</p></span><span id="sec0045" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0040">Conflicto de intereses</span><p id="par0105" class="elsevierStylePara elsevierViewall">Parte de este texto se present&#243; como comunicaci&#243;n oral al <span class="elsevierStyleSmallCaps">II</span> Congreso Iberoamericano de Epidemiolog&#237;a y Salud P&#250;blica&#46;</p><p id="par0110" class="elsevierStylePara elsevierViewall">La autora declara que pertenece al comit&#233; editorial de <span class="elsevierStyleSmallCaps">Gaceta Sanitaria&#44;</span>pero que no ha participado en el proceso editorial del manuscrito&#46;</p></span></span>"
    "textoCompletoSecciones" => array:1 [
      "secciones" => array:9 [
        0 => array:2 [
          "identificador" => "sec0005"
          "titulo" => "La necesidad de hip&#243;tesis"
        ]
        1 => array:2 [
          "identificador" => "sec0010"
          "titulo" => "El origen de los big data y sus posibles sesgos"
        ]
        2 => array:2 [
          "identificador" => "sec0015"
          "titulo" => "El an&#225;lisis de los datos"
        ]
        3 => array:2 [
          "identificador" => "sec0020"
          "titulo" => "La generaci&#243;n de conocimiento y su transferencia"
        ]
        4 => array:2 [
          "identificador" => "sec0025"
          "titulo" => "Aspectos sociales&#44; &#233;ticos y pol&#237;ticos de la investigaci&#243;n con big data"
        ]
        5 => array:2 [
          "identificador" => "sec0030"
          "titulo" => "Conclusiones y recomendaciones"
        ]
        6 => array:2 [
          "identificador" => "sec0035"
          "titulo" => "Contribuciones de autor&#237;a"
        ]
        7 => array:2 [
          "identificador" => "sec0045"
          "titulo" => "Conflicto de intereses"
        ]
        8 => array:1 [
          "titulo" => "Bibliograf&#237;a"
        ]
      ]
    ]
    "pdfFichero" => "main.pdf"
    "tienePdf" => true
    "fechaRecibido" => "2015-07-13"
    "fechaAceptado" => "2015-09-30"
    "bibliografia" => array:2 [
      "titulo" => "Bibliograf&#237;a"
      "seccion" => array:1 [
        0 => array:2 [
          "identificador" => "bibs0005"
          "bibliografiaReferencia" => array:16 [
            0 => array:3 [
              "identificador" => "bib0085"
              "etiqueta" => "1"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Big data meets public health"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:2 [
                            0 => "B&#46;M&#46;J&#46; Khoury"
                            1 => "J&#46;P&#46;A&#46; Ioannidis"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1126/science.aaa2709"
                      "Revista" => array:6 [
                        "tituloSerie" => "Science&#46;"
                        "fecha" => "2014"
                        "volumen" => "346"
                        "paginaInicial" => "1054"
                        "paginaFinal" => "1055"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/25430753"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            1 => array:3 [
              "identificador" => "bib0090"
              "etiqueta" => "2"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Converting big data into public health"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:3 [
                            0 => "I&#46; Chun-Hai-Fung"
                            1 => "Z&#46; Tsz-Ho-Tse"
                            2 => "K-W&#46; Fu"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1126/science.347.6222.620-c"
                      "Revista" => array:5 [
                        "tituloSerie" => "Science&#46;"
                        "fecha" => "2015"
                        "volumen" => "347"
                        "paginaInicial" => "620"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/25657238"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            2 => array:3 [
              "identificador" => "bib0095"
              "etiqueta" => "3"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Harvard School of Public Health&#46; Big data&#39;s big visionary&#46; Magazine&#46; &#91;Internet&#93;&#46; Harvard&#59; 2014&#46; p&#46; 32-49&#46; &#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a id="intr0005" class="elsevierStyleInterRef" href="http://www.hsph.harvard.edu/news/magazine/big-datas-big-visionary/">http&#58;&#47;&#47;www&#46;hsph&#46;harvard&#46;edu&#47;news&#47;magazine&#47;big-datas-big-visionary&#47;</a>"
                ]
              ]
            ]
            3 => array:3 [
              "identificador" => "bib0100"
              "etiqueta" => "4"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Standen A&#46; How big data is changing medicine listen&#58; KQED Science &#91;Internet&#93;&#46; 2014&#46; &#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a id="intr0010" class="elsevierStyleInterRef" href="http://ww2.kqed.org/science/2014/09/29/how-big-data-is-changing-medicine/">http&#58;&#47;&#47;ww2&#46;kqed&#46;org&#47;science&#47;2014&#47;09&#47;29&#47;how-big-data-is-changing-medicine&#47;</a>"
                ]
              ]
            ]
            4 => array:3 [
              "identificador" => "bib0105"
              "etiqueta" => "5"
              "referencia" => array:1 [
                0 => array:3 [
                  "comentario" => "&#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a class="elsevierStyleInterRef" id="intr0015" href="http://www.ncbi.nlm.nih.gov/pubmed/22955613">http&#58;&#47;&#47;www&#46;ncbi&#46;nlm&#46;nih&#46;gov&#47;pubmed&#47;22955613</a>"
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "The making of ENCODE&#58; lessons for big-data projects"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:1 [
                            0 => "E&#46; Birney"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Nature &#91;Internet&#93;"
                        "fecha" => "2012"
                        "volumen" => "489"
                        "paginaInicial" => "49"
                        "paginaFinal" => "51"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            5 => array:3 [
              "identificador" => "bib0110"
              "etiqueta" => "6"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "From data mining to knowledge discovery in"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:3 [
                            0 => "U&#46; Fayyad"
                            1 => "G&#46; Piatetsky-shapiro"
                            2 => "P&#46; Smyth"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Intell Artif Mag&#46;"
                        "fecha" => "1996"
                        "volumen" => "17"
                        "paginaInicial" => "37"
                        "paginaFinal" => "54"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            6 => array:3 [
              "identificador" => "bib0115"
              "etiqueta" => "7"
              "referencia" => array:1 [
                0 => array:3 [
                  "comentario" => "&#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a class="elsevierStyleInterRef" id="intr0020" href="http://www.nasonline.org/programs/sackler-colloquia/completed_colloquia/Big-data.html?referrer=https://www.google.es/">http&#58;&#47;&#47;www&#46;nasonline&#46;org&#47;programs&#47;sackler-colloquia&#47;completed&#95;colloquia&#47;Big-data&#46;html&#63;referrer&#61;https&#58;&#47;&#47;www&#46;google&#46;es&#47;</a>"
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Introduction to the Sackler Colloquium&#44; drawing causal inference from big data"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:1 [
                            0 => "R&#46; Shiffrin"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Libro" => array:4 [
                        "titulo" => "Introduction to Sackler Colloqium &#91;Internet&#93;"
                        "fecha" => "2015"
                        "editorial" => "National Academy of Sciences"
                        "editorialLocalizacion" => "Washington&#44; D&#46;C&#46;"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            7 => array:3 [
              "identificador" => "bib0120"
              "etiqueta" => "8"
              "referencia" => array:1 [
                0 => array:3 [
                  "comentario" => "&#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a class="elsevierStyleInterRef" id="intr0025" href="http://www.ncbi.nlm.nih.gov/pubmed/20581876">http&#58;&#47;&#47;www&#46;ncbi&#46;nlm&#46;nih&#46;gov&#47;pubmed&#47;20581876</a>"
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Hints of hidden heritability in GWAS"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:1 [
                            0 => "G&#46; Gibson"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Nat Genet &#91;Internet&#93;&#46; Nature Publishing Group&#59;"
                        "fecha" => "2010"
                        "volumen" => "42"
                        "paginaInicial" => "558"
                        "paginaFinal" => "560"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            8 => array:3 [
              "identificador" => "bib0125"
              "etiqueta" => "9"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Critical questions for big data&#58; provocations for a cultural&#44; technological&#44; and scholarly phenomenon"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:2 [
                            0 => "D&#46; Boyd"
                            1 => "K&#46; Crawford"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Information&#44; Commun Soc&#46;"
                        "fecha" => "2012"
                        "volumen" => "15"
                        "paginaInicial" => "662"
                        "paginaFinal" => "679"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            9 => array:3 [
              "identificador" => "bib0130"
              "etiqueta" => "10"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "President&#39;s address the environment and disease"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:1 [
                            0 => "A-B&#46; Hill"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:6 [
                        "tituloSerie" => "Proc R Soc Med&#46;"
                        "fecha" => "1965"
                        "volumen" => "58"
                        "paginaInicial" => "295"
                        "paginaFinal" => "300"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/14283879"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            10 => array:3 [
              "identificador" => "bib0135"
              "etiqueta" => "11"
              "referencia" => array:1 [
                0 => array:3 [
                  "comentario" => "&#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a class="elsevierStyleInterRef" id="intr0030" href="http://cebp.aacrjournals.org/cgi/doi/10.1158/1055-9965.EPI-13-0146">http&#58;&#47;&#47;cebp&#46;aacrjournals&#46;org&#47;cgi&#47;doi&#47;10&#46;1158&#47;1055-9965&#46;EPI-13-0146</a>"
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Transforming epidemiology for 21st century medicine and public health"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:3 [
                            0 => "M&#46;J&#46; Khoury"
                            1 => "T&#46;K&#46; Lam"
                            2 => "J&#46;P&#46; Ioannidis"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1158/1055-9965.EPI-13-0146"
                      "Revista" => array:6 [
                        "tituloSerie" => "Cancer Epidemiol Biomarkers Prev &#91;Internet&#93;&#46;"
                        "fecha" => "2013"
                        "volumen" => "22"
                        "paginaInicial" => "508"
                        "paginaFinal" => "516"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/23462917"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            11 => array:3 [
              "identificador" => "bib0140"
              "etiqueta" => "12"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Advancing global health research through digital technology and sharing data"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:1 [
                            0 => "T&#46; Lang"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1126/science.1199349"
                      "Revista" => array:6 [
                        "tituloSerie" => "Science&#46;"
                        "fecha" => "2011"
                        "volumen" => "331"
                        "paginaInicial" => "714"
                        "paginaFinal" => "717"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/21311011"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            12 => array:3 [
              "identificador" => "bib0145"
              "etiqueta" => "13"
              "referencia" => array:1 [
                0 => array:3 [
                  "comentario" => "&#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a class="elsevierStyleInterRef" id="intr0035" href="http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=1762059%26tool=pmcentrez%26rendertype=Abstract">http&#58;&#47;&#47;www&#46;pubmedcentral&#46;nih&#46;gov&#47;articlerender&#46;fcgi&#63;artid&#61;1762059&#38;tool&#61;pmcentrez&#38;rendertype&#61;Abstract</a>"
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "The Malaria Atlas Project&#58; developing global maps of malaria risk"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:2 [
                            0 => "S&#46;I&#46; Hay"
                            1 => "R&#46;W&#46; Snow"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1371/journal.pmed.0030473"
                      "Revista" => array:5 [
                        "tituloSerie" => "PLoS Med &#91;Internet&#93;&#46;"
                        "fecha" => "2006"
                        "volumen" => "3"
                        "paginaInicial" => "e473"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/17147467"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            13 => array:3 [
              "identificador" => "bib0150"
              "etiqueta" => "14"
              "referencia" => array:1 [
                0 => array:3 [
                  "comentario" => "&#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a class="elsevierStyleInterRef" id="intr0040" href="http://www.globalhealthaction.net/index.php/gha/article/view/5302">http&#58;&#47;&#47;www&#46;globalhealthaction&#46;net&#47;index&#46;php&#47;gha&#47;article&#47;view&#47;5302</a>"
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Ageing and adult health status in eight lower-income countries&#58; the INDEPTH WHO-SAGE collaboration"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:3 [
                            0 => "P&#46; Kowal"
                            1 => "K&#46; Kahn"
                            2 => "N&#46; Ng"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Glob Health Action &#91;Internet&#93;&#46;"
                        "fecha" => "2010"
                        "volumen" => "3"
                        "paginaInicial" => "11"
                        "paginaFinal" => "22"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            14 => array:3 [
              "identificador" => "bib0155"
              "etiqueta" => "15"
              "referencia" => array:1 [
                0 => array:3 [
                  "comentario" => "&#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a class="elsevierStyleInterRef" id="intr0045" href="http://www.ncbi.nlm.nih.gov/pubmed/24626916">http&#58;&#47;&#47;www&#46;ncbi&#46;nlm&#46;nih&#46;gov&#47;pubmed&#47;24626916</a>"
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "The parable of Google flu&#58; traps in big data analysis"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:3 [
                            0 => "D&#46; Lazer"
                            1 => "R&#46; Kennedy"
                            2 => "G&#46; King"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1126/science.1248506"
                      "Revista" => array:6 [
                        "tituloSerie" => "Science &#91;Internet&#93;&#46;"
                        "fecha" => "2014"
                        "volumen" => "343"
                        "paginaInicial" => "1203"
                        "paginaFinal" => "1205"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/24626916"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            15 => array:3 [
              "identificador" => "bib0160"
              "etiqueta" => "16"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "European Comission&#46; Why do we need an EU data protection reform&#63; &#91;Internet&#93;&#46; 2011&#46; p&#46; 10-1&#46; &#40;Consultado el 10&#47;05&#47;2015&#46;&#41; Disponible en&#58; <a id="intr0050" class="elsevierStyleInterRef" href="http://ec.europa.eu/justice/data-protection/document/review2012/factsheets/1_en.pdf">http&#58;&#47;&#47;ec&#46;europa&#46;eu&#47;justice&#47;data-protection&#47;document&#47;review2012&#47;factsheets&#47;1&#95;en&#46;pdf</a>"
                ]
              ]
            ]
          ]
        ]
      ]
    ]
  ]
  "idiomaDefecto" => "es"
  "url" => "/02139111/0000003000000001/v2_201603031726/S0213911115002046/v2_201603031726/es/main.assets"
  "Apartado" => array:4 [
    "identificador" => "791"
    "tipo" => "SECCION"
    "es" => array:2 [
      "titulo" => "Debates"
      "idiomaDefecto" => true
    ]
    "idiomaDefecto" => "es"
  ]
  "PDF" => "https://static.elsevier.es/multimedia/02139111/0000003000000001/v2_201603031726/S0213911115002046/v2_201603031726/es/main.pdf?idApp=WGSE&text.app=https://gacetasanitaria.org/"
  "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S0213911115002046?idApp=WGSE"
]
Share
Publish in this journal
Journal Information
Vol. 30. Issue 1.
Pages 66-68 (January - February 2016)
Visits
Not available
Vol. 30. Issue 1.
Pages 66-68 (January - February 2016)
Debate
Open Access
Peligros del uso de los big data en la investigación en salud pública y en epidemiología
Risks of the use of big data in research in public health and epidemiology
Visits
38785
Glòria Pérez
Agència de Salut Pública de Barcelona, Barcelona, España
This item has received

Under a Creative Commons license
Article information
Full Text
Bibliography
Download PDF
Statistics
Full Text

Even John Snow needed to start with a plausible hypothesis to know where to look and choose what data to examine1.

La realidad incuestionable es la aparición de los big data (datos masivos). Este término se refiere a los grandes volúmenes de información compleja y conectable que crece continuamente, de modo que la información parece duplicarse cada 2 años, y este fenómeno podría estarse acelerando. En este sentido, cabe destacar que mucha de esta información era inaccesible hace solo una década.

Los datos masivos proceden de múltiples fuentes de información, derivados de diferentes contextos, tales como los financieros, la informática de negocio, el ocio, las redes sociales y las redes laborales, las ciencias ambientales y también la salud. En este último ámbito existen múltiples fuentes de información derivadas de la medicina asistencial, la genómica, la biología molecular, la clínica, la epidemiología y la salud pública, entre otras.

La investigación en salud pública y en epidemiología tiene por objetivo conocer la salud de la población y sus determinantes2. Los posibles beneficios de los big data en la investigación en este campo son el uso de diversas fuentes de información y la rapidez en el análisis3. Estas dos características, según algunas opiniones, podrían dejar el método científico actual obsoleto4. No comparto esta última opinión. Parece que nos volvemos a enfrentar al mismo problema que hace tres décadas con la llegada de los ordenadores personales, cuando se creía que la velocidad de análisis iba a cambiar el método científico en la investigación epidemiológica. Es por ello que centraré mi contribución a este debate en señalar los «peligros» del uso de los big data en la investigación en salud pública y en epidemiología.

La necesidad de hipótesis

Disponer de datos es una de las bases para el progreso científico. En investigación usamos modelos, a veces complejos, como una forma de aproximación a la realidad. Estos modelos de análisis de datos se sustentan en hipótesis y en marcos conceptuales, sin los cuales sería imposible realizar investigación. Aunque parece claro que las hipótesis han de guiar la investigación cualquiera que sea el volumen de datos, existen diversas posiciones al respecto. Por un lado, están las personas que creen que los datos nos dirán aquello que queremos saber. Esta posición es muy cercana al «ir de pesca» en los datos, adjudicándoles un cierto «buenismo» debido a que el gran tamaño nos permitirá realizar inferencias estadísticas fiables4. En el otro extremo se situarían aquellas personas que creen que analizar los big data es analizar terabytes de ruido para obtener un megabyte de señal, y por tanto usarían los big data en modelos causales más o menos simples que se prueban en entornos muy controlados.

Estas dos posiciones están explicadas de una forma un tanto simplista, pero describen las dificultades con que nos enfrentamos las personas que nos dedicamos a la investigación, sin que por el momento tengamos una comprensión demasiado sólida de cómo abordar de manera sistemática y eficiente lo que suponen los big data en la investigación en salud pública y en epidemiología5.

El origen de los big data y sus posibles sesgos

Los datos útiles para la investigación en salud pública y en epidemiología proceden habitualmente de fuentes diseñadas ad hoc para la investigación o bien de fuentes secundarias, como las historias clínicas, pruebas de laboratorio, censo de población, registros de enfermedades, etc. Lo que distinguiría al entorno big data es, por un lado, la incorporación de otras fuentes de información, como las derivados de los servicios prestados por las App de e-salud, wereables, las redes sociales o las plataformas «nube», entre otras, y la posibilidad de realizar la consulta a múltiples fuentes de datos online4.

Hay que señalar que los datos que se obtienen de estas plataformas son muestras de conveniencia y pueden tener un número importante de sesgos de selección y de información, de los cuales no nos protege el tamaño de los datos. Un ejemplo de sesgo de información podría ser el uso de los Twitterbots, programas usados para producir mensajes automatizados que permiten, mediante el acceso a potenciales clientes, mejorar el posicionamiento de una empresa. Al contrario, puede surgir un sinnúmero de asociaciones, algunas de ellas debidas al azar y a la existencia de sesgos como el de confusión. También, las empresas de estas plataformas mejoran los servicios a los usuarios constantemente, lo cual podría afectar a la comparabilidad de los datos a lo largo del tiempo. Tampoco es fácil obtener datos y replicar los resultados de los estudios para poder determinar su robustez.

El análisis de los datos

La minería de datos es la exploración automática o semiautomática de los grandes conjuntos de datos con la intención de descubrir patrones. Es uno de los pasos que componen el proceso del knowledge discovery in databases6, en el cual se incluyen la recolección y la preparación de los datos, la interpretación de los resultados y la información de estos. Sin embargo, la minería de datos genera ciertos desafíos para la ciencia actual7. El primero, como ya se ha mencionado, es la búsqueda de patrones en los big data. Para ilustrarlo, Shiffrin7 pone un ejemplo: «Supongamos una base de datos de un terabyte de datos con la posibilidad de contener mil factores medibles. El número de posibles correlaciones de esos factores sería del orden de dos por mil». Y el segundo es la posibilidad de asociaciones espurias, que Shiffrin7 expone claramente: «En una base de terabytes de datos, el factor A se correlaciona con el factor B, y esta podría ser una relación causal directa entre ambos factores; sin embargo, también podría haber unos 10310 otros potenciales bucles causales y las distribuciones de probabilidad asignadas a las 10310 posibilidades».

La tecnología permite y permitirá analizar un ingente volumen de datos y establecer innumerables asociaciones mediante modelos complejos. Habrá que desarrollar nuevas propuestas que traten los niveles de significación estadística de forma diferente, tal como se hizo evidente al tener que desarrollar los Manhattan plot8 para los estudios de epidemiología genética. Sin embargo, la mayor complejidad de las herramientas analíticas podría tener como consecuencia posibles limitaciones en la transparencia de los métodos y en la interpretación y la replicabilidad de los resultados9.

Todo ello nos lleva a recordar los criterios de causalidad de Bradford Hill, en los que la fuerza de asociación estadística es solo una de las nueve condiciones para establecer la causalidad10.

La generación de conocimiento y su transferencia

La generación de conocimiento es un proceso dinámico de síntesis, interpretación, integración y difusión de los resultados de la investigación11. Es indudable que Internet ha permitido la mejora del trabajo de campo de las encuestas, la recogida de datos y los procesos de compartir datos y de intercambio del conocimiento12, como ya está ocurriendo en algunas redes internacionales (por ejemplo, la de la malaria13 y la de demografía14).

Sin embargo, existen otros ámbitos, como son las predicciones de alertas con consecuencias para la salud de la población, en los cuales, aunque se ha demostrado el alto valor alcanzado, aún se está lejos de poder suplantar a los métodos más tradicionales15.

Tampoco puede desecharse la posibilidad de la manipulación por parte de empresas con ánimo de lucro, o bien desde visiones corporativas que muy lícitamente para sus intereses pretenden influir mediante los big data en las decisiones sobre la salud de la población, sin obviar que puedan tener una mayor capacidad de transferencia que las instituciones públicas encargadas de la salud pública.

Un aspecto no desdeñable es poder refutar o aceptar resultados de estudios basados en los big data. No obstante, requerirá que el estudio esté bien sustentado metodológicamente, sea cual sea el origen de los datos.

Aspectos sociales, éticos y políticos de la investigación con big data

La regulación europea prevé la protección de los datos personales, entre los que se encuentran los de la salud de la ciudadanía16. Sin embargo, existen países donde la normativa puede ser más laxa o inexistente, y donde obtener estos datos puede ser más fácil. Por otro lado, la dependencia económica de los países de renta baja imposibilita que ejerzan la soberanía sobre sus datos frente a los países de renta alta. A lo anterior cabría añadir que en la mayoría de los casos es difícil que los resultados de las investigaciones reviertan en la población que los ha originado, debido a la inestabilidad política, la corrupción, la pobreza y la precariedad de los sistemas de salud y del acceso a las nuevas tecnologías. Los avances científicos que se deriven de esas investigaciones deberían mejorar la salud y los determinantes de la salud de la población en esos países.

Conclusiones y recomendaciones

Se concluye que las buenas prácticas en la investigación en salud pública y en epidemiología no han de ser diferentes para las investigaciones que usen big data. Por tanto, la división entre la investigación con big data y la investigación tradicional no parece pertinente.

Los investigadores e investigadoras de la salud pública y la epidemiología deberían desempeñar un papel central en la propuesta de hipótesis innovadoras, en la construcción de infraestructuras para el almacenamiento de grandes conjuntos de datos y en asegurar el desarrollo de enfoques sistemáticos en el análisis de grandes conjuntos de datos complejos y masivos. Para ello, las sociedades científicas relacionadas con la salud pública y la epidemiología deberían proponer una estrategia formativa y abrir un debate necesario en nuestro colectivo.

Contribuciones de autoría

Autora única.

Conflicto de intereses

Parte de este texto se presentó como comunicación oral al II Congreso Iberoamericano de Epidemiología y Salud Pública.

La autora declara que pertenece al comité editorial de Gaceta Sanitaria,pero que no ha participado en el proceso editorial del manuscrito.

Bibliografía
[1]
B.M.J. Khoury, J.P.A. Ioannidis.
Big data meets public health.
Science., 346 (2014), pp. 1054-1055
[2]
I. Chun-Hai-Fung, Z. Tsz-Ho-Tse, K-W. Fu.
Converting big data into public health.
[3]
Harvard School of Public Health. Big data's big visionary. Magazine. [Internet]. Harvard; 2014. p. 32-49. (Consultado el 10/05/2015.) Disponible en: http://www.hsph.harvard.edu/news/magazine/big-datas-big-visionary/
[4]
Standen A. How big data is changing medicine listen: KQED Science [Internet]. 2014. (Consultado el 10/05/2015.) Disponible en: http://ww2.kqed.org/science/2014/09/29/how-big-data-is-changing-medicine/
[5]
E. Birney.
The making of ENCODE: lessons for big-data projects.
Nature [Internet], 489 (2012), pp. 49-51
(Consultado el 10/05/2015.) Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/22955613
[6]
U. Fayyad, G. Piatetsky-shapiro, P. Smyth.
From data mining to knowledge discovery in.
Intell Artif Mag., 17 (1996), pp. 37-54
[7]
R. Shiffrin.
Introduction to the Sackler Colloquium, drawing causal inference from big data.
Introduction to Sackler Colloqium [Internet], National Academy of Sciences, (2015),
[8]
G. Gibson.
Hints of hidden heritability in GWAS.
Nat Genet [Internet]. Nature Publishing Group;, 42 (2010), pp. 558-560
(Consultado el 10/05/2015.) Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/20581876
[9]
D. Boyd, K. Crawford.
Critical questions for big data: provocations for a cultural, technological, and scholarly phenomenon.
Information, Commun Soc., 15 (2012), pp. 662-679
[10]
A-B. Hill.
President's address the environment and disease.
Proc R Soc Med., 58 (1965), pp. 295-300
[11]
M.J. Khoury, T.K. Lam, J.P. Ioannidis, et al.
Transforming epidemiology for 21st century medicine and public health.
Cancer Epidemiol Biomarkers Prev [Internet]., 22 (2013), pp. 508-516
[12]
T. Lang.
Advancing global health research through digital technology and sharing data.
Science., 331 (2011), pp. 714-717
[13]
S.I. Hay, R.W. Snow.
The Malaria Atlas Project: developing global maps of malaria risk.
[14]
P. Kowal, K. Kahn, N. Ng, et al.
Ageing and adult health status in eight lower-income countries: the INDEPTH WHO-SAGE collaboration.
Glob Health Action [Internet]., 3 (2010), pp. 11-22
[15]
D. Lazer, R. Kennedy, G. King, et al.
The parable of Google flu: traps in big data analysis.
Science [Internet]., 343 (2014), pp. 1203-1205
(Consultado el 10/05/2015.) Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/24626916
[16]
European Comission. Why do we need an EU data protection reform? [Internet]. 2011. p. 10-1. (Consultado el 10/05/2015.) Disponible en: http://ec.europa.eu/justice/data-protection/document/review2012/factsheets/1_en.pdf
Copyright © 2015. SESPAS
Download PDF
Idiomas
Gaceta Sanitaria
Article options
Tools
es en

¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?

Are you a health professional able to prescribe or dispense drugs?