Hot Chips 2024: IBM presenta su procesador Telum II y el acelerador Spyre

IBM ha revelado, durante el Hot Chips 2024, la arquitectura del nuevo procesador IBM Telum II y el acelerador IBM Spyre, tecnologías diseñadas para los sistemas IBM Z de próxima generación. Estas innovaciones prometen un incremento significativo en la capacidad de procesamiento, con un enfoque especial en la aceleración de modelos de inteligencia artificial (IA), tanto tradicionales como de gran escala, como los modelos de lenguaje grandes (LLM). 

 

IBM Telum II
Foto: cortesía IBM

 

Demandas de IA y eficiencia energética

A medida que los proyectos de IA generativa basados en LLM pasan de la prueba de concepto a la producción, la necesidad de soluciones energéticamente eficientes, seguras y escalables se convierte en una prioridad. Un estudio de Morgan Stanley proyecta que la demanda de energía de la IA generativa crecerá un 75% anual, alcanzando en 2026 niveles similares al consumo energético de España en 2022. Esto resalta la importancia de la arquitectura eficiente de IBM para apoyar modelos de IA híbridos y escalables, adaptándose a las necesidades de los clientes.

 

Procesador IBM Telum II

El Telum II cuenta con mejoras significativas respecto a su predecesor, el Telum I, con un incremento del 40% en la capacidad de caché y un núcleo acelerador de IA integrado. Este nuevo chip también incluye una unidad de procesamiento de datos (DPU) para acelerar las operaciones de entrada/salida (E/S) en redes y almacenamiento. Estas características permiten que el Telum II impulse soluciones para modelos de lenguaje grandes (LLM) y satisfaga las demandas complejas de transacciones en sectores como la banca y los seguros.

 

 

IBM Telum II Spyre
Foto: cortesía IBM

Acelerador IBM Spyre

El acelerador Spyre complementa al Telum II, formando una arquitectura escalable que soporta la combinación de múltiples modelos de IA. Esta práctica permite mejorar la precisión y robustez de las predicciones frente a modelos individuales. Spyre es una tarjeta escalable, conectada a través de un adaptador PCIe de 75 W, y ha sido desarrollada en colaboración con el IBM Research AI Hardware Center. Su diseño admite un enfoque flexible para diversas aplicaciones de IA, optimizando tanto el rendimiento como la eficiencia energética.

 

Innovación y rendimiento

El Telum II, fabricado por Samsung Foundry con tecnología de 5 nm, incluye ocho núcleos que operan a 5.5 GHz y un caché de nivel 2 de 36 MB por núcleo, lo que representa un aumento del 40% en capacidad de caché respecto a la generación anterior. Además, su acelerador de IA integrado mejora la detección de fraudes en transacciones financieras, aumentando cuatro veces la capacidad de cómputo en comparación con su predecesor.

 

Por su parte, el Spyre tiene hasta 32 núcleos de cómputo por chip, compatibles con tipos de datos int8, fp8 y fp16, optimizando el rendimiento en aplicaciones de IA de baja latencia. Con hasta 1 TB de memoria y capacidad para operar junto a ocho tarjetas IO estándar, Spyre permite manejar modelos de IA complejos en el entorno mainframe.

 

El procesador Telum II y el acelerador Spyre estarán disponibles para los clientes de IBM Z y LinuxONE en 2025, ofreciendo una solución robusta para la creciente demanda de aplicaciones de IA generativa y modelos de lenguaje a gran escala. Según Tina Tarquinio, Vicepresidenta de gestión de productos IBM Z y LinuxONE, estas innovaciones permitirán a las empresas aprovechar el poder de la IA generativa y optimizar el valor empresarial mediante un rendimiento seguro y eficiente.

Version Digital NEO

NEO 299

 


Recibe las noticias mas relevantes de marketing y negocios
didi

 

Reach Me