Todas las organizaciones que conforman lo que llamamos el sector Salud (hospitales, institutos de investigación, fundaciones, etc.) generan y acumulan diaria e incrementalmente ingentes cantidades de datos. Esta tendencia viene impulsada por la obligación de mantener registros y por el doble deseo de mejorar la calidad de la asistencia y reducir su coste.
Todos estos datos, que hasta hace no tanto se almacenaban en papel, se orientan claramente hacia la digitalización. Y su inmensa generación de información, por no entrar en excesivos detalles, pasa a formar parte de lo que se conoce como “Big Data”.
Hasta aquí todo suena bien. Aséptico y prometedor. Pero no hay que engañarse, el sector Salud, como otros, se encuentra desbordado, no sólo por el volumen, sino también por la heterogeneidad y la velocidad a la que se genera toda esa información y a la que deben gestionarse para ser eficaz.
Para entenderlo mejor, debemos precisar un poco más: ¿de qué hablamos cuando lo hacemos de “Big Data” en Salud? Se trata de multitud de elementos diferentes: datos clínicos que llegan o no de sistemas informáticos (notas escritas del facultativo, recetas, imágenes diagnósticas, pruebas de laboratorio, farmacia, …); información del paciente en su historia clínica digital (EHR); datos generados por sensores para monitorización de signos vitales; datos genómicos; incluso información con origen de redes sociales y muchos otros menos específicos, pero que también tienen importancia, como pueden ser datos de cuidadores o artículos especializados.
No hay que dedicar mucho esfuerzo para comprender el valor y la complejidad de la información de la que hablamos. La mayor parte de los datos generados no son estructurados y la adaptación de técnicas analíticas utilizadas en otros sectores todavía tiene que afrontar importantes retos tecnológicos en el sector Salud. Mencionemos solo algunos de los muchos que hay:
• Favorecer la integración e interoperabilidad de los enormes “data lakes” (con problemas técnicos, legales y de gestión).
• Ser capaces de generar o adaptar la documentación sin crear esfuerzos adicionales para los profesionales (que no sería nada aconsejable en Sistemas Sanitarios ya desbordados).
• Enriquecer los contenidos no estructurados con anotaciones semánticas y transformar la información de gestión en estratégica (los hospitales, por ejemplo, acumulan no sólo la información relativa a individuos de su población, sino también estadísticas agregadas de las actuaciones realizadas. Datos como el número de pacientes atendidos por servicio, consultas, estancias medias, intervenciones quirúrgicas, pruebas diagnósticas, etc. generalmente son usados tan solo como medidores de gestión).
• Adoptar tecnologías de procesamiento del lenguaje natural.
Para incrementar la nada pequeña complejidad (bendita sea, por cierto) desde hace no demasiado tenemos nuevas fuentes de información “nómica” que añaden posibilidades infinitas. La tendencia del Big Data en este sentido parece presentar dos vertientes: por un lado, la parte genómica en sí misma y, por otro, la relacionada con la clínica del paciente. El reto es la integración de ambas.
De su complejidad baste una simple pincelada: los actuales datos procedentes de la genómica de un solo paciente suponen alrededor 4TB de datos en formatos sin procesar. Si proyectamos esa cantidad a una determinada población (por ejemplo, la que pasa por un hospital de tamaño medio a lo largo de un mes) estamos hablando de petabytes. Pero es que referido a un único paciente, como decíamos antes, también se incluye otra gran cantidad de elementos, ya que disponemos de toda la información de la historia clínica.
A pesar de ello, hay que avanzar con paso firma hacia la integración. Y hay que hacerlo, porque los datos de las Historias Clínicas Digitales junto con los datos de salud que se pueden obtener de dispositivos IoT ofrecen oportunidades inéditas para avanzar en futuras investigaciones.
De un uso imaginativo de esta información integrada dispondríamos de medios eficientes para poder hacer cosas tan increíbles como:
• Elaborar tendencias y análisis anticipativos con nuevas técnicas de modelado y predicción.
• Crear nuevos modos de seguimiento y vigilancia a gran escala para incidencias sanitarias.
• Hacer seguimiento de la progresión de enfermedades en tiempo real en poblaciones concretas que podríamos estructurar en el momento.
• Identificación perfeccionada de grupos poblacionales de pacientes que puedan ser considerados en futuros ensayos clínicos.
• Descubrir asociaciones y sinergias sanitarias de modo automatizado gracias a la aplicación de sistemas de cálculo neural (imaginemos el salto que daremos en este sentido cuando podamos disponer de cómputo cuántico).
• Mejorar la detección de biomarcadores basados en datos de origen molecular que faciliten la clasificación de pacientes en función de su respuesta a los tratamientos.
• Identificar nuevas interacciones farmacológicas (con el objetivo, por ejemplo, de descubrir si un tratamiento puede dejar de actuar eficazmente o lo hace de un modo inesperado ante la presencia de otro)
• Facilitar la detección de fraudes sanitarios.
• Crear nuevos modos de analíticas para salud pública (ejemplo: evolución de patología en base al análisis de datos publicados en redes, generando alertas tempranas e incluso campañas automatizadas de concienciación y recomendaciones)
• Elaborar nuevos segmentos poblacionales en base a variables dinámicas.
Son solo unos ejemplos a vuela pluma. Existen cientos más y a medida que tengamos más tecnología aplicada y más profesionales dedicados, las posibilidades serán inmensas.
La tecnología asociada al análisis de Big Data es insustituible el futuro de la Salud. Y es así, porque, en definitiva, hablamos de mejorar la atención, reducir errores y variabilidad en la práctica clínica, ahondar en el camino de la deseable medicina personalizada y basada en evidencias y, aunque suene menos elevado pero igualmente importante, reducir los costes de hacer todo ello. Nuevos retos y nuevas ilusiones.