NEWS

Intel muestra su propuesta de chiplet óptico para arquitecturas de IA escalables



Dirección copiada

Se espera que el chiplet de interconexión óptica de cómputo de Intel revolucione el procesamiento de datos de alta velocidad para la infraestructura de IA

Publicado el 2 jul 2024



Intel muestra su propuesta de chiplet óptico para arquitecturas de IA escalables
Intel muestra su propuesta de chiplet óptico para arquitecturas de IA escalables

Intel ha presentado el chiplet de interconexión óptica de cómputo (OCI) más avanzado y completamente integrado de la industria, que se combina con una CPU Intel y ejecuta datos en tiempo real. El chiplet OCI de Intel representa un salto adelante en la interconexión de gran ancho de banda, ya que permite la entrada/salida (E/S) óptica coempaquetada en la infraestructura de IA emergente para centros de datos y aplicaciones informáticas de alto rendimiento (HPC).

“El creciente movimiento de datos de servidor a servidor está poniendo a prueba las capacidades de la infraestructura actual de centros de datos, y las soluciones actuales están alcanzando rápidamente los límites prácticos del rendimiento de E/S eléctrico. Sin embargo, el logro innovador de Intel capacita a los clientes para integrar sin problemas soluciones de interconexión de silicio fotónico coempaquetado en sistemas informáticos de próxima generación. Nuestro chiplet OCI aumenta el ancho de banda, reduce el consumo de energía y aumenta el alcance, permitiendo la aceleración de cargas de trabajo de aprendizaje automático que promete revolucionar la infraestructura de inteligencia artificial de alto rendimiento”, asegura Thomas Liljeberg, senior director, Product Management and Strategy, Integrated Photonics Solutions (IPS) Group.

Facilitando la conectividad de CPU/GPU

Este primer chiplet OCI está diseñado para soportar 64 canales de transmisión de datos de 32 gigabits por segundo (Gbps) en cada dirección en hasta 100 metros de fibra óptica y se espera que responda a las crecientes demandas de la infraestructura de IA de mayor ancho de banda, menor consumo de energía y mayor alcance. Permite la escalabilidad futura de la conectividad de clústeres de CPU/GPU y arquitecturas informáticas novedosas, como la expansión coherente de la memoria y la desagregación de recursos.

Las aplicaciones basadas en inteligencia artificial se están implementando cada vez más a nivel global, y los desarrollos recientes en modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) y en inteligencia artificial generativa están acelerando esta tendencia. Modelos de aprendizaje automático más grandes y eficientes jugarán un papel clave en abordar los requisitos emergentes de cargas de trabajo de aceleración de IA. La necesidad de escalar plataformas informáticas futuras para IA está impulsando un crecimiento exponencial en el ancho de banda de E/S y un mayor alcance para soportar clústeres de unidades de procesamiento (CPU/GPU/IPU) más grandes y arquitecturas con una utilización de recursos más eficiente, como la desagregación de xPU y el agrupamiento de memoria.

La E/S eléctrica (es decir, la conectividad de cobre) admite una gran densidad de ancho de banda y un bajo consumo, pero sólo ofrece alcances cortos de un metro o menos. Los módulos transceptores ópticos enchufables utilizados en los centros de datos y los primeros clústeres de IA pueden aumentar el alcance a niveles de coste y consumo que no son sostenibles con los requisitos de escalado de las cargas de trabajo de IA. Una solución de E/S óptica xPU coempaquetada puede soportar mayores anchos de banda con una eficiencia energética mejorada, baja latencia y mayor alcance, exactamente lo que requiere el escalado de la infraestructura de IA/ML.

Como analogía, sustituir la E/S eléctrica por E/S óptica en CPU y GPU para transferir datos es como pasar de utilizar carruajes de caballos para distribuir mercancías, limitados en capacidad y alcance, a utilizar coches y camiones que pueden entregar cantidades mucho mayores de mercancías en distancias mucho más largas. Este nivel de mejora del rendimiento y del coste energético es lo que las soluciones de E/S óptica como el chiplet OCI de Intel que está surgiendo aportan al escalado de la IA.

Así funciona el chiplet óptico de Intel

El chiplet OCI totalmente integrado aprovecha la tecnología fotónica de silicio de Intel probada en la práctica e integra un circuito integrado fotónico de silicio (PIC), que incluye láseres y amplificadores ópticos en el chip, con un circuito integrado eléctrico. El chiplet OCI presentado en la OFC se empaquetó junto con una CPU Intel, pero también puede integrarse con CPU, GPU, IPU y otros sistemas en chip (SoC) de próxima generación. 

Esta primera implementación de OCI admite una transferencia de datos bidireccional de hasta 4 terabits por segundo (Tbps), compatible con la interconexión de componentes periféricos express (PCIe) Gen5. La demostración de enlace óptico en directo muestra una conexión de transmisor (Tx) y receptor (Rx) entre dos plataformas de CPU a través de un cable de conexión de fibra monomodo (SMF). Las CPU generaron y midieron la tasa de errores de bits (BER) óptica, y la demostración muestra el espectro óptico Tx con 8 longitudes de onda a 200 gigahercios (GHz) de separación en una sola fibra, junto con un diagrama de ojo Tx de 32 Gbps que ilustra la gran calidad de la señal.

El chiplet actual soporta 64 canales de datos de 32 Gbps en cada dirección hasta 100 metros (aunque las aplicaciones prácticas pueden estar limitadas a decenas de metros debido a la latencia de tiempo de vuelo), utilizando ocho pares de fibras, cada uno transportando ocho longitudes de onda de multiplexación por división densa (DWDM, dense wavelength division multiplexing wavelengths, por sus siglás en inglés). La solución coempaquetada también es notablemente eficiente en energía, consumiendo solo 5 pico-julios (pJ) por bit en comparación con los módulos transceptores ópticos enchufables que consumen aproximadamente 15 pJ/bit. Este nivel de hiper-eficiencia es crucial para los centros de datos y entornos de computación de alto rendimiento, y podría ayudar a abordar los requisitos insostenibles de energía de la inteligencia artificial.

Artículos relacionados

Artículo 1 de 5