Inova Translational Medicine Institute cuenta con Cloudera para machine learning

El Instituto de Investigación analiza los datos del genoma para avanzar en la medicina de precisión, con el objetivo de predecir y prevenir enfermedades.

Publicado el 13 Jun 2017

laboratorio médico Inova

Cloudera, proveedor de una plataforma de análisis, gestión de datos y machine learning construida sobre las últimas tecnologías open source, ha anunciado que Inova Translational Medicine Institute (ITMI), un destacado instituto de investigación médica, está utilizando Cloudera Enterprise para analizar de forma segura colecciones masivas de datos clínicos y genómicos a velocidades y escalas sin precedentes, para fomentar innovaciones más rápidas en investigación en medicina traslacional. Como parte del Centro Inova de Salud Personal (ICPH, por sus siglas en inglés), el equipo de científicos, investigadores, analistas y colaboradores de ITMI aplica algoritmos de machine learning en terabytes de información clínica y genómica para identificar los vínculos genéticos con las enfermedades. De ese modo, pueden hacer descubrimientos a partir de la información de los datos y, en colaboración con el médico tratante, desarrollan planes de tratamiento personalizados para los pacientes. Este enfoque también se conoce como medicina de precisión y tiene el poder de ayudar a los pacientes a vivir vidas más largas y saludables.

La genética juega un papel fundamental dentro de la mayoría de las principales causas de muerte en los Estados Unidos, incluyendo enfermedades cardíacas, cáncer y diabetes. El Instituto recoge datos clínicos de miles de pacientes nacidos en más de 110 países. El ADN de una sola persona contiene seis mil millones de bits de información. Mapear los códigos de ADN individuales en las secuencias del genoma, ayuda a los científicos a determinar la causa de las enfermedades y a descubrir nuevos tratamientos. Como parte de este proceso, ITMI también está reuniendo lo que se espera sea una de las bases de datos de secuencias del genoma más grandes del mundo que también se encontrarán conectados a la historia del paciente en un sistema de atención médica.

“El desafío para los investigadores y científicos de ITMI era analizar nuestra colección de datos en bruto, sumamente compleja y masiva, de forma más rápida y eficiente, y traducir las ideas en un cuidado práctico del paciente. Ahora podemos obtener respuestas en minutos y segundos y podemos encontrar correlaciones que no hemos podido ver antes “, explica Aaron Black, Chief Data Officer en ITMI. “Nuestros investigadores solían gastar el 80 por ciento de su tiempo en disputas de datos y sólo una pequeña cantidad de tiempo en el análisis. Estamos en el proceso de revertir eso. Ahora podemos acelerar el ritmo del descubrimiento genómico y cambiar drásticamente la forma en que interactuamos con nuestros equipos de investigación. Creemos que mejorará nuestra capacidad de proporcionar los tratamientos correctos a los pacientes adecuados y, en última instancia, mejorar los resultados. Cloudera ha hecho que esto sea posible”.

La plataforma de Cloudera permitió a ITMI optimizar su análisis de datos genómicos para su descubrimiento. Este análisis genómico de datos permite a un científico de bioinformática estudiar las correlaciones genómicas de personas con condiciones como la artritis, enfermedades autoinmunes o cáncer. En el pasado, dado el tamaño masivo de genomas enteros, este proceso podía tomar a ITMI alrededor de dos meses para lograrlo. Utilizando Cloudera, ITMI puede realizar análisis de datos de extremo a extremo en una semana. En el futuro, ITMI espera hacer estos análisis de datos en sólo unas horas.

Trabajando con Cloudera, ITMI construyó una infraestructura de bioinformática para la recopilación de datos de genomas del Instituto, emparejados con el registro clínico. La infraestructura fue diseñada para almacenar y procesar esta convergencia de datos biológicos a velocidades y escalas propias del futuro.

Mientras que un genoma equivale a más de tres mil millones de pares de bases de ADN, ITMI actualmente rastrea aproximadamente 9.000 genomas completamente secuenciados, con intención de llegar a los 15.000 en el futuro. La moderna base de datos analítica de Cloudera, impulsada por Apache Impala (incubating), permite acceder a analíticas SQL de alto rendimiento para el Big Data. Con la flexibilidad, la escala y la velocidad que proporciona Cloudera, el equipo de ITMI podrá aplicar la concurrencia de varios usuarios y desarrollar análisis de alto rendimiento de datos genómicos recopilados de madres, padres y niños inscritos en diversos estudios. Por ejemplo, ITMI ha sido capaz de aprovechar su experiencia en análisis clínico y genómico para ayudar a descubrir anomalías congénitas previamente no diagnosticadas en los bebés. Este es un proceso lento e iterativo, pero gracias a herramientas como Cloudera, ITMI espera poder acelerar estos descubrimientos para ayudar a estas familias.

¿Qué te ha parecido este artículo?

Tu opinión es importante para nosotros.

D
Redacción Data Center Market

Artículos relacionados

Artículo 1 de 3