Fujitsu ha anunciado el lanzamiento de una tecnología de middleware de computación de IA diseñada para mejorar la eficiencia computacional de la GPU en el procesamiento de IA y hacer frente a la escasez mundial de GPU. La nueva tecnología integra la tecnología de asignación adaptativa de GPU patentada por Fujitsu, que asigna las GPU de forma dinámica para lograr un procesamiento de alta eficiencia en tiempo real, con diversas técnicas de optimización del procesamiento de IA.
Tras el éxito de las pruebas piloto, ya hay compañías que lo están integrando, como por ejemplo TRADOM, que comenzará a utilizar soluciones basadas en la tecnología del agente informático de IA en octubre de 2024. Además, SAKURA Internet Inc ha iniciado un estudio de viabilidad sobre la tecnología de agente informático de IA para las operaciones de su centro de datos. A partir de mayo de 2024, Fujitsu también ha estado realizando pruebas de esta tecnología de nuevo desarrollo con AWL, Inc, Xtreme-D Inc, y Morgenroty ha demostrado mejoras significativas en las operaciones de estas empresas. Las pruebas confirmaron un aumento de hasta 2,25 veces en la eficiencia computacional de varios procesos de IA y un aumento sustancial en el número de procesos de IA gestionados simultáneamente en diversos entornos y servidores en la nube.
La tecnología recién desarrollada estará disponible para los clientes de Japón a partir del 22 de octubre de 2024 y para los usuarios de todo el mundo.
Índice de temas
Abordar el creciente consumo de energía de la IA con la asignación adaptativa de GPU
Impulsada por el rápido aumento de la demanda mundial de tecnología de IA (incluida la IA generativa), la necesidad de GPU, que son más adecuadas para el procesamiento de IA que las CPU, ha aumentado drásticamente. Se prevé que el mercado mundial de IA generativa se multiplique aproximadamente por 20 entre 2023 y 2030 y que, en consecuencia, la demanda de GPU aumente a un ritmo similar. Sin embargo, el aumento del consumo de energía en los centros de datos para satisfacer esta demanda de GPU representa un reto importante. Fujitsu calcula que los centros de datos consumirán el 10% de la electricidad mundial en 2030.
Para hacer frente a este reto social global, Fujitsu desarrolló en noviembre de 2023 una tecnología de asignación adaptativa de GPU. La tecnología optimiza el uso de CPU y GPU asignando recursos en tiempo real para dar prioridad a los procesos con alta eficiencia de ejecución, incluso si la GPU está ejecutando un programa. Fujitsu ha estado realizando pruebas de verificación de esta tecnología de asignación en varias plataformas.
Detalles del nuevo agente de computación de IA
El nuevo middleware AI computing broker integra la tecnología de asignación adaptativa de GPU con las tecnologías de optimización del procesamiento de IA, lo que permite identificar y optimizar automáticamente la asignación de recursos de GPU para el procesamiento de IA en múltiples programas.
A diferencia de la asignación convencional por tarea, el broker de computación de IA de Fujitsu asigna dinámicamente los recursos de la GPU por GPU, aprovechando la experiencia en optimización computacional de Fujitsu para mejorar las tasas de disponibilidad. Las funciones de gestión de la memoria de la GPU de la tecnología permiten a los usuarios ejecutar numerosos procesos de IA sin preocuparse por el uso de la memoria de la GPU o la capacidad física.
En las pruebas previas al lanzamiento, el broker de computación de IA de Fujitsu demostró una mejora de hasta 2,25 veces en el rendimiento de procesamiento de la GPU en términos de tiempo por unidad en comparación con las implantaciones que no utilizaban la tecnología. Además, la gestión de la memoria de la tecnología permite manejar simultáneamente hasta 150 GB de procesamiento de IA, aproximadamente cinco veces la capacidad de memoria física de la GPU.