En su evento anual AWS re:Invent, Amazon Web Services ha anunciado nuevos componentes para sus propios centros de datos, que están diseñados para apoyar la próxima generación de innovación en inteligencia artificial (IA) y las necesidades en evolución de los clientes.
A medida que el uso de la IA generativa continúa creciendo y aumentan las demandas de capacidad de GPU, los centros de datos de AWS se están adaptando para soportar densidades de potencia cada vez mayores. Las principales mejoras incluyen:
Índice de temas
Diseño eléctrico y mecánico simplificado para alta disponibilidad
Los diseños eléctricos y mecánicos simplificados son más confiables y fáciles de mantener, lo que garantiza que los clientes disfruten de la alta confiabilidad que AWS ha ofrecido desde el principio. Las últimas mejoras en el diseño de los centros de datos de AWS incluyen sistemas eléctricos y mecánicos simplificados, que permiten una disponibilidad de infraestructura del 99.9999%. Estos sistemas simplificados también reducen en un 89% el número potencial de racks que pueden verse afectados por problemas eléctricos.
En un centro de datos, la electricidad pasa por múltiples sistemas de conversión y distribución antes de llegar al equipo de TI. Cada paso introduce ineficiencias, pérdida de energía y posibles puntos de fallo. Por ejemplo, AWS ha simplificado la distribución eléctrica, reduciendo en un 20% los posibles puntos de fallo. Otras simplificaciones incluyen acercar la energía de respaldo al rack y reducir el número de ventiladores utilizados para expulsar el aire caliente. AWS utiliza la diferencia natural de presión para expulsar el aire caliente, lo que mejora la cantidad de electricidad disponible para los servidores.
Innovaciones en refrigeración, diseño de racks y sistemas de control
AWS ha desarrollado una serie de capacidades nuevas y mejoradas para ofrecer a los clientes una infraestructura con el mejor rendimiento, alta disponibilidad y máxima eficiencia energética posible. Las innovaciones en los centros de datos incluyen:
- Refrigeración líquida: Los servidores de IA más recientes se benefician de la refrigeración líquida para enfriar de manera más eficiente los chips de cómputo de alta densidad. AWS ha desarrollado soluciones mecánicas novedosas que ofrecen refrigeración líquida configurable directamente al chip, tanto en sus nuevos centros de datos como en los existentes. Algunas tecnologías de AWS utilizan infraestructura de red y almacenamiento que no requieren refrigeración líquida, por lo que los sistemas de refrigeración actualizados integrarán perfectamente capacidades de refrigeración por aire y líquido para los chipsets de IA más potentes, como AWS Trainium2 y soluciones de supercomputación de IA a nivel de rack, como NVIDIA GB200 NVL72, así como switches de red y servidores de almacenamiento de AWS. Este diseño flexible y multimodal de refrigeración permite a AWS proporcionar el máximo rendimiento y eficiencia al menor coste, ya sea para cargas de trabajo tradicionales o modelos de IA. El diseño único de racks con refrigeración líquida fue desarrollado en colaboración con fabricantes líderes de chips para acelerar el tiempo de comercialización de las cargas de trabajo de IA.
- Soporte para cargas de trabajo de IA de alta densidad: AWS está optimizando el uso de energía maximizando cómo posiciona los racks en un centro de datos. Esto se logró mediante software, impulsado por datos y tecnología de IA generativa, que predice la forma más eficiente de ubicar los servidores. AWS ahora reducirá la cantidad de energía desperdiciada o subutilizada y hará un uso más eficiente de la energía disponible. Este diseño soportará la próxima generación de hardware y racks de alta densidad requeridos para cargas de trabajo de IA, pero es lo suficientemente flexible para acomodar una amplia variedad de otros tipos de hardware. La infraestructura de AWS ofrece la plataforma de cómputo más amplia y profunda, con más de 750 instancias de Amazon Elastic Cloud Compute (Amazon EC2), brindando a los clientes opciones de procesadores, almacenamiento, redes, sistemas operativos y modelos de compra para cualquier carga de trabajo. Además del diseño flexible y multimodal de refrigeración, AWS ha desarrollado innovaciones en ingeniería de sus sistemas de entrega de energía, lo que permitirá a AWS soportar un aumento de seis veces en la densidad de potencia por rack en los próximos dos años, y otro aumento de tres veces en el futuro. Esto se logra en parte gracias a un nuevo estante de energía, que entrega energía eficientemente a través del rack, reduciendo las pérdidas de conversión eléctrica. En conjunto, estas innovaciones permiten a AWS ofrecer un 12% más de potencia de cómputo por sitio para las cargas de trabajo de los clientes. Estos cambios reducirán la cantidad total de centros de datos necesarios para proporcionar la misma capacidad de cómputo.
- Sistemas de control actualizados: La implementación de un sistema de control propiedad de Amazon en los dispositivos eléctricos y mecánicos de AWS permite estandarizar la monitorización, las alarmas y las secuencias operativas. Por ejemplo, las herramientas de telemetría internas de AWS, construidas con tecnologías de AWS, proporcionan diagnósticos en tiempo real y servicios de resolución de problemas. Además, AWS ha aumentado la redundancia en sus sistemas de control, al tiempo que ha reducido su complejidad. Estos beneficios permiten a AWS diseñar infraestructura con una disponibilidad del 99.9999%.
Mayor eficiencia energética y sostenibilidad
Según AWS, algunas investigaciones estiman que la infraestructura de AWS es hasta 4.1 veces más eficiente que la infraestructura local, y cuando las cargas de trabajo se optimizan en AWS, la huella de carbono asociada puede reducirse hasta en un 99%. En 2023, Amazon alcanzó su meta de igualar el 100% de la electricidad consumida por sus operaciones con energía renovable, siete años antes de su objetivo fijado para 2030.
AWS reevalúa continuamente cómo operan sus centros de datos y busca formas de utilizar la energía de manera más eficiente a través de innovaciones constantes. Los nuevos componentes incluyen las siguientes mejoras en eficiencia energética y sostenibilidad:
- Sistema de refrigeración más eficiente, que se espera reduzca el consumo de energía mecánica hasta en un 46% en comparación con el diseño anterior durante condiciones de enfriamiento máximo, sin aumentar el uso de agua por megavatio. Los cambios en el diseño incluyen un nuevo sistema de enfriamiento unilateral, la reducción del equipo de refrigeración y la introducción de capacidades de refrigeración líquida.
- Reducción del carbono incorporado en el concreto de la estructura del centro de datos hasta en un 35% en comparación con el promedio de la industria. AWS está adoptando especificaciones para acero y concreto de menor carbono, y optimizando el diseño estructural para usar menos acero en general.
- Generadores de respaldo capaces de funcionar con diésel renovable, un combustible biodegradable y no tóxico que puede reducir las emisiones de gases de efecto invernadero hasta en un 90% durante su ciclo de vida en comparación con el diésel fósil. AWS ya ha comenzado la transición hacia el uso de diésel renovable para alimentar generadores de respaldo en centros de datos existentes en Europa y América.