La supercomputadora Aurora con tecnología Intel es la más rápida en IA

En ISC High Performance 2024, Intel anunció en colaboración con el Laboratorio Nacional Argonne y Hewlett Packard Enterprise (HPE) que la supercomputadora Aurora ha superado la barrera de la exaescala de 1.012 exaflops y es el sistema de IA más rápido del mundo dedicado a la IA para ciencia abierta, logrando 10,6 exaflops de IA. Intel también detallará el papel crucial de los ecosistemas abiertos en el impulso de la computación de alto rendimiento (HPC) de alto rendimiento acelerada por IA. «La supercomputadora Aurora que supere la exaescala le permitirá allanar el camino hacia los descubrimientos del mañana. Desde comprender los patrones climáticos hasta desentrañar los misterios del universo, las supercomputadoras sirven como una brújula que nos guía hacia la resolución de desafíos científicos verdaderamente difíciles que pueden mejorar a la humanidad», dijo Ogi Brkic, vicepresidente de Intel y director general de Soluciones de IA para centros de datos.

Diseñado como un sistema centrado en la IA desde su inicio, Aurora permitirá a los investigadores aprovechar los modelos generativos de IA para acelerar los descubrimientos científicos. Se han logrado avances significativos en las primeras investigaciones impulsadas por la IA de Argonne. Las historias de éxito incluyen el mapeo de los 80 mil millones de neuronas del cerebro humano, la física de partículas de alta energía mejorada mediante el aprendizaje profundo y el diseño y descubrimiento de fármacos acelerados por el aprendizaje automático, entre otros. La supercomputadora Aurora es un sistema expansivo con 166 racks, 10,624 blades de cómputo, 21,248 procesadores Intel Xeon CPU Max Series y 63,744 unidades Intel Data Center GPU Max Series, lo que lo convierte en uno de los grupos de GPU más grandes del mundo.

Aurora también incluye la mayor interconexión de supercomputación abierta basada en Ethernet en un solo sistema de 84,992 puntos finales de estructura HPE slingshot. La supercomputadora Aurora quedó en segundo lugar en el punto de referencia LINPACK (HPL) de alto rendimiento, pero rompió la barrera de la exaescala con 1.012 exaflops utilizando 9.234 nodos, solo el 87% del sistema. La supercomputadora Aurora también aseguró el tercer lugar en el punto de referencia de gradiente conjugado de alto rendimiento (HPCG) con 5.612 TeraFLOPS por segundo (TF/s) con el 39% de la máquina. Este punto de referencia tiene como objetivo evaluar escenarios más realistas que proporcionen información sobre los patrones de comunicación y acceso a la memoria, que son factores importantes en las aplicaciones HPC del mundo real. Complementa puntos de referencia como LINPACK al ofrecer una visión integral de las capacidades de un sistema.

En el corazón de la supercomputadora Aurora se encuentra la serie Intel Data Center GPU Max. La arquitectura de GPU Intel Xe es fundamental para la serie Max y presenta hardware especializado, como bloques de computación matricial y vectorial, optimizados para tareas de IA y HPC. El diseño de la arquitectura Intel Xe, que ofrece un rendimiento informático incomparable, es la razón por la que la supercomputadora Aurora obtuvo el primer puesto en la prueba comparativa de precisión mixta LINPACK de alto rendimiento (HPL-MxP), que resalta mejor la importancia de las cargas de trabajo de IA en HPC.

Las capacidades de procesamiento paralelo de la arquitectura Xe destacan en la gestión de las intrincadas operaciones de matriz-vector inherentes al cálculo de la IA de redes neuronales. Estos núcleos informáticos son fundamentales para acelerar las operaciones matriciales cruciales para los modelos de aprendizaje profundo. Complementada por el conjunto de herramientas de software de Intel, incluido el compilador Intel oneAPI DPC++/C++, un rico conjunto de bibliotecas de rendimiento y marcos y herramientas de IA optimizados, la arquitectura Xe fomenta un ecosistema abierto para desarrolladores que se caracteriza por su flexibilidad y escalabilidad en varios dispositivos y factores de forma.

En su sesión especial en ISC 2024, el martes 14 de mayo a las 6:45 pm, (GMT+2) Hall 4, Centro de Congresos de Hamburgo, Alemania, el director ejecutivo Andrew Richards de Codeplay, una empresa de Intel, abordará la creciente demanda de tecnología acelerada. informática y software en HPC e IA. Destacará la importancia de oneAPI, que ofrece un modelo de programación unificado en diversas arquitecturas. Desarrollada sobre estándares abiertos, oneAPI permite a los desarrolladores crear código que se ejecuta sin problemas en diferentes plataformas de hardware sin grandes modificaciones ni dependencia de un proveedor. Este es también el objetivo de la Fundación de Aceleración Unificada (UXL) de la Fundación Linux, en la que Arm, Google, Intel, Qualcomm y otros están desarrollando un ecosistema abierto para todos los aceleradores y computación heterogénea unificada en estándares abiertos para romper el bloqueo de propiedad. La Fundación UXL está sumando más miembros a su creciente coalición.

Mientras tanto, Intel Tiber Developer Cloud está ampliando su capacidad informática con nuevas plataformas de hardware de última generación y nuevas capacidades de servicio que permiten a las empresas y desarrolladores evaluar la última arquitectura Intel, innovar y optimizar modelos y cargas de trabajo de IA rápidamente, y luego implementar modelos de IA a escala. El nuevo hardware incluye versiones preliminares de los sistemas Intel Xeon 6 E-core y P-core para clientes selectos, y clusters a gran escala basados en Intel Gaudi 2 y Intel Data Center GPU Max Series. Las nuevas capacidades incluyen Intel Kubernetes Service para cargas de trabajo de inferencia y capacitación de IA nativas de la nube y cuentas multiusuario.

Las nuevas supercomputadoras que se están implementando con las tecnologías Intel Xeon CPU Max Series y Intel Data Center GPU Max Series subrayan el objetivo de Intel de avanzar en HPC e IA. Los sistemas incluyen Cassandra del Centro Euromediterráneo sobre Cambio Climático (CMCC) para acelerar la modelización del cambio climático; CRESCO 8 de la Agencia Nacional Italiana para Nuevas Tecnologías, Energía y Desarrollo Económico Sostenible (ENEA) para permitir avances en la energía de fusión; el Centro de Computación Avanzada de Texas (TACC), que está en plena producción para permitir el análisis de datos desde biología hasta flujos de turbulencia supersónica y simulaciones atomísticas en una amplia gama de materiales; así como la Autoridad de Energía Atómica del Reino Unido (UKAEA) para resolver problemas ligados a la memoria que sustentan el diseño de futuras centrales eléctricas de fusión.

El resultado del punto de referencia de IA de precisión mixta será fundamental para la GPU de próxima generación de Intel para IA y HPC, cuyo nombre en código es Falcon Shores. Falcon Shores aprovechará la arquitectura Intel Xe de próxima generación con lo mejor de Intel Gaudí. Esta integración permite una interfaz de programación unificada.

Los primeros resultados de rendimiento en Intel Xeon 6 con núcleos P y memoria de rangos combinados multiplexores (MCR) a 8800 megatransferencias por segundo (MT/s) ofrecen una mejora de rendimiento de hasta 2,3 veces para aplicaciones HPC del mundo real, como Nucleus para el modelado europeo del Ocean (NEMO), en comparación con la generación anterior, establece una base sólida como la opción de CPU host preferida para soluciones HPC.

You may also like

Leave a Comment