Lenovo ha anunciado su acuerdo con la Universidad Tecnológica Chalmers para usar una infraestructura tecnológica de Lenovo y NVIDIA en su recurso computacional a gran escala Alvis. El proyecto ha visto la entrega e implementación de un sistema de computación en clúster para la investigación mediante la inteligencia artificial (IA) y el aprendizaje automático (ML) en lo que es el mayor clúster de HPC (computación de alto rendimiento) para IA y ML en la región de Europa, Oriente Medio y África.
Alvis (que en escandinavo antiguo significa «omnisciente») es un recurso de supercomputación nacional perteneciente a SNIC (la infraestructura nacional sueca para la computación). Se inició a principios de 2020 y desde entonces se ha desarrollado para sostener una capacidad que resuelva las extensas tareas de investigación a la mayor escala. El sistema computacional, financiado por la Fundación Knut y Alice Wallenberg y suministrado por Lenovo, se encuentra ubicado en la Universidad Tecnológica Chalmers, en Gotemburgo, sede de la mayor iniciativa de investigación de la Unión Europea: Graphene Flagship.
Este proyecto colaborativo permite a los investigadores suecos que necesiten mejorar sus cálculos y modelos matemáticos aprovechar los servicios de Alvis a través del sistema de aplicaciones de SNIC, con independencia del campo de investigación en el que trabajen. Con ello se ayuda a los investigadores que ya están utilizando el aprendizaje automático para analizar problemas complejos, y a aquellos que están investigando el uso del aprendizaje automático para resolver problemas en sus respectivos campos, con el potencial de dirigir innovadoras investigaciones académicas en campos como la computación cuántica y la investigación impulsada por datos para la sanidad y la ciencia.
Potenciando una infraestructura de IA que ahorra energía
Chalmers ha decidido implementar un clúster escalable con varios servidores Lenovo ThinkSystem para proporcionar la combinación perfecta de GPU NVIDIA a sus usuarios de modo que se de prioridad al ahorro de energía y el equilibrio de las cargas de trabajo. Esto incluye el sistema Lenovo ThinkSystem SD650-N V2 para proporcionar la potencia de las GPU NVIDIA A100 Tensor Core, y el ThinkSystem SR670 V2, certificado por NVIDIA, para las GPU NVIDIA A40 y T4.
La arquitectura de almacenamiento proporciona una nueva solución Ceph de 7.8 petabytes que se integrará en el entorno de almacenamiento actual en Chalmers. NVIDIA Quantum 200 Gb/s InfiniBand propriociona el sistema con baja latencia, alto rendimiento de los datos en red y motores inteligentes de aceleración de la computación. Con estas funcionalidades de infraestructura de alta velocidad, los usuarios cuentan con casi 1.000 GPU, sobre todo NVIDIA A100 Tensor Core, que incluyen más de 260.000 núcleos de procesamiento y más de 800 TFLOPS de potencia computacional para lograr unos tiempos de respuesta mucho más rápidos en sus investigaciones.
Además, Alvis utiliza las tecnologías de refrigeración líquida NeptuneTM de Lenovo para lograr una eficiencia informática incomparable. En un principio, se propuso un sistema de enfriamiento solo por aire para el proyecto, pero Chalmers decidió en su lugar poner en marcha las funcionalidades de refrigeración mediante agua caliente de Lenovo Neptune para reducir los costes operativos a largo plazo y lograr un sistema de infraestructura de IA más ecológico. Como resultado, la universidad espera importantes ahorros energéticos gracias a las eficiencias de refrigeración por agua.