IBM y el Centro Marshall de Vuelos Espaciales de la NASA han anunciado una colaboración para utilizar la inteligencia artificial (IA) de IBM para descubrir nuevos conceptos dentro en el enorme volumen de datos científicos geoespaciales y de la Tierra de la NASA. El trabajo conjunto aplicará por primera vez la tecnología de modelo fundacional de IA a los datos satelitales de observación de la Tierra de la NASA. Los modelos fundacionales son tipos de modelos de IA que se entrenan en un amplio conjunto de datos no etiquetados y que se pueden usar para diferentes tareas o aplicar información sobre una situación a otra. Estos modelos han avanzado rápidamente en el campo de la tecnología de procesamiento del lenguaje natural (NLP) en los últimos cinco años, e IBM es pionera en aplicaciones de modelos básicos más allá del lenguaje.
Las observaciones de la Tierra que permiten a los científicos estudiar y monitorizar nuestro planeta se están recopilando a un ritmo y volumen sin precedentes. En este sentido, se requieren enfoques nuevos e innovadores para extraer conocimiento de estos vastos recursos de datos. Por tanto, el objetivo de este trabajo es proporcionar a los investigadores una manera más fácil de analizar y extraer información de estos grandes conjuntos de datos. La tecnología del modelo fundacional de IBM tiene el potencial de acelerar el descubrimiento y análisis de estos datos para avanzar rápidamente en la comprensión científica de la Tierra y dar respuesta a los problemas relacionados con el clima.
IBM y la NASA planean desarrollar varias tecnologías nuevas para extraer información de las observaciones de la Tierra. Un proyecto entrenará un modelo básico de inteligencia geoespacial de IBM en el conjunto de datos Harmonized Landsat Sentinel-2 (HLS), un registro de la superficie terrestre y los cambios en el uso de la tierra capturados por los satélites en órbita terrestre. Al analizar los petabytes de datos satelitales para identificar cambios en la huella geográfica de fenómenos como desastres naturales, rendimientos cíclicos de cultivos y hábitats de vida silvestre, esta tecnología modelo fundacional ayudará a los investigadores a proporcionar un análisis crítico de los sistemas ambientales de nuestro planeta.
El futuro
Se espera que esta colaboración también dé como resultado un corpus de literatura de ciencias de la Tierra que se pueda buscar fácilmente. IBM ha desarrollado un modelo de PNL entrenado con casi 300.000 artículos de revistas de ciencias de la Tierra para organizar la literatura y facilitar el descubrimiento de nuevos conocimientos. Contiene una de las mayores cargas de trabajo de IA entrenadas en el software de Red Hat OpenShift hasta la fecha, el modelo completamente entrenado utiliza PrimeQA, el sistema de preguntas y respuestas multilingüe de código abierto de IBM. Más allá de proporcionar un recurso a los investigadores, el nuevo modelo de lenguaje para las ciencias de la Tierra podría infundirse en los procesos de gestión y administración de datos científicos de la NASA.
“La belleza de los modelos fundacionales es que potencialmente se pueden usar para muchas aplicaciones posteriores”, dice Rahul Ramachandran, científico investigador principal del Centro Marshall de Vuelos Espaciales de la NASA en Huntsville, Alabama. “La construcción de estos modelos no puede ser abordada por equipos pequeños”, añade. “Se necesitan equipos en diferentes organizaciones para aportar sus diferentes perspectivas, recursos y conjuntos de habilidades”.
“Los modelos fundacionales han demostrado ser exitosos en el procesamiento del lenguaje natural, y es hora de expandirlo a nuevos dominios y modalidades importantes para los negocios y la sociedad”, apunta Raghu Ganti, investigador principal de IBM. “La aplicación de modelos fundacionales a factores geoespaciales, de secuencia de eventos, series temporales y otros factores no lingüísticos dentro de los datos de ciencias de la Tierra podría hacer que las ideas e información enormemente valiosas estén disponibles para un grupo mucho más amplio de investigadores, empresas y ciudadanos. En última instancia, podría ayudar a un mayor número de personas que trabajan en algunos de nuestros problemas climáticos más urgentes”.
Otros posibles proyectos conjuntos IBM-NASA en este acuerdo incluyen la construcción de un modelo fundacional para la predicción meteorológica y climática utilizando MERRA2, un conjunto de datos de observaciones atmosféricas. Esta colaboración es parte de la Iniciativa de Ciencia de Código Abierto de la NASA, un compromiso para construir una comunidad de ciencia abierta inclusiva, transparente y colaborativa durante la próxima década.