OPINIÓN

Una nueva forma de comunicarnos con nuestros datos ha llegado



Dirección copiada

Una nueva forma de comunicarnos con nuestros datos ha llegado gracias a ChatGPT y nuevos modelos de lenguaje como interfaz de usuario

Publicado el 31 oct 2023

Ignacio Rodríguez Ferrero

Machine Learning Engineer en Solver IA



Ignacio Rodríguez Ferrero, Machine Learning Engineer en Solver IA
Ignacio Rodríguez Ferrero, Machine Learning Engineer en Solver IA

La forma en la que interactuamos con nuestros ordenadores o dispositivos móviles marca también la forma en la que podemos usarlos. La interfaz, ese punto de fricción entre el ordenador y el usuario, dicta cómo nos comunicamos con los sistemas y cómo accedemos a nuestros datos. Una interfaz bien diseñada puede darle alas a un producto mientras que una mal diseñada, puede sumirlo en un olvido perpetuo.

Ahora bien, una interfaz no es solo el aspecto con el que se presenta un sistema al usuario, es también la experiencia que recibe éste al usarlo. Un ejemplo que revolucionó internet en su día, dando una nueva experiencia a la recuperación de información fue el buscador de Google. El buscador de Yahoo, ya en funcionamiento en aquel entonces, funcionaba con un sistema de categorías, pero Google redujo la dificultad de uso mediante la búsqueda por palabras clave. Desde entonces ha sido la herramienta de búsqueda más usada, al menos hasta ahora, ya que un nuevo paradigma en las interfaces de usuario se ha presentado de la mano de OpenAI: los modelos de lenguaje como interfaz de usuario.

Por qué supone ChatGPT una nueva forma de comunicarnos con nuestros datos

En este contexto, nace ChatGPT, un sistema conversacional automático super-realista que utiliza un modelo de lenguaje para la generación de respuestas. Sin embargo, lo que el usuario obtiene de ChatGPT no es un simple chat, es una fuente de información que responde a preguntas en lenguaje natural (no a palabras clave), y es capaz de saber qué parte de tu consulta es relevante para darte una respuesta. Las maravillas de ChatGPT son muchas, pero en este caso la relevante es la forma en la que transmite información al usuario con lenguaje natural.

La información de ChatGPT se encuentra en lo que se denomina una base de datos estocástica, que significa que la respuesta generada es la estadísticamente más probable según los datos usados para su creación, sin saber a ciencia cierta si la respuesta a la pregunta es correcta, si está respondiendo algo dañino al usuario o si los datos originales eran falsos desde un comienzo. Esta sería una excelente interfaz, si estuviéramos seguros de que lo que responde es siempre cierto y pudiéramos ver de dónde se ha sacado esa información, pero esto no se puede.

¿O sí se puede? ¿Qué pasaría si antes de preguntar a ChatGPT buscáramos nosotros unos documentos entre los que sí podría estar la respuesta y relegáramos al modelo de lenguaje a una interfaz que decida dónde está la respuesta? En tal caso sí podríamos trazar el origen de la respuesta y se podría contrastar en caso de necesidad ya que conocemos el documento fuente. Pero esto continúa con un problema: si el usuario tiene que buscar la información de antemano la pregunta está resuelta, se ha buscado manualmente y el sistema no sirve de nada. Si existiera un sistema que recupera documentos, como por ejemplo páginas web y los listara en orden de relevancia, esto sería un sistema automático listo para ser usado, pero en la actualidad no existe.

¿O sí existe? Lo que queremos es un sistema de recuperación de información, algo como Google. Al poner estas dos piezas juntas, un generador de respuestas alimentado por un sistema de recuperación de información obtenemos lo que se llama un sistema de Generación Aumentado por Recuperación (o RAG por sus siglas en inglés). Lo mejor de los sistemas de RAG es que esta primera pieza de recuperación de información es intercambiable por cualquier sistema de búsqueda. De hecho, existe una alternativa mejor a Google que funciona con la misma tecnología que el modelo de lenguaje de ChatGPT: Transformers.

Aplicaciones y sectores donde es útil

Estos modelos neuronales realizan una búsqueda vectorial en la que se calcula la “similitud” entre nuestra pregunta y los documentos uno a uno, para luego recuperar los más parecidos. La base de datos ya no es implícita, es explícita, existe en un lugar físico y se puede modificar. Ahora que ya tenemos nuestros documentos, éstos se pueden poner en ChatGPT con un poco de Prompt Engineering y recibir nuestra respuesta con la certeza de que la misma proviene de los documentos recuperados. La base de datos puede contener cualquier tipo de documento: contratos, resoluciones de un tribunal, etc. Utilizado nuestros propios documentos podemos crear un ChatGPT personalizado, que conozca todos los documentos relevantes para nuestra organización.

Sean datos públicos o privados, las aplicaciones son infinitas y los sectores que se pueden beneficiar de ello también: un bufete de abogados en la búsqueda de jurisprudencia, empresas del sector retail con los manuales de uso de sus productos, búsquedas en un historial médico, métricas internas de rendimiento, búsquedas de facturas, regulaciones, notas internas o transcripciones. Una nueva forma de comunicarnos con nuestros datos ha llegado y se van a poder hacer cosas que hasta ahora eran imposibles.

Artículos relacionados

Artículo 1 de 4