Durante la reciente conferencia GTC, el CEO de NVIDIA, Jensen Huang, anunció los planes de la compañía para integrar más de mil GPU en un único sistema de computación masivo antes de 2028 mediante el uso de interconexiones fotónicas. Para respaldar este crecimiento, NVIDIA ha invertido miles de millones de dólares en empresas líderes de comunicación óptica e interconexión, como Marvell, Coherent y Lumentum, con el fin de asegurar su cadena de suministro de cara al futuro.
En su discurso principal, Huang subrayó la enorme demanda de capacidad que enfrenta el ecosistema actual. "Necesitamos más cables de cobre, más componentes ópticos y mayor capacidad de óptica coempaquetada (CPO); esa es la razón por la que estamos sentando las bases del crecimiento junto a nuestros socios", afirmó.
La evolución tecnológica: del cobre a la óptica
El giro de NVIDIA hacia la óptica no es casualidad. Tras el lanzamiento de ChatGPT en 2022, la empresa se dio cuenta de que sus sistemas actuales de ocho GPU ya no bastaban para entrenar modelos de IA a gran escala. El posterior sistema Grace Blackwell NVL72 logró conectar 72 GPU en un solo bloque mediante kilómetros de cableado de cobre en el backplane; sin embargo, aunque alcanza un ancho de banda de 1,8 TB/s, la distancia de transmisión del cobre es extremadamente limitada.
Gilad Shainer, vicepresidente sénior de redes en NVIDIA, señaló que, si bien el cobre es rentable y eficiente en términos de consumo energético para distancias cortas, la atenuación de la señal impone restricciones físicas severas. Esto explica por qué los NVSwitch dentro de los racks NVL72 deben estar agrupados, ya que el alcance efectivo del cobre es de apenas unos pocos pies. A medida que los sistemas escalan hacia las miles de GPU, las limitaciones físicas del cobre se han convertido en un cuello de botella insostenible.
Históricamente, el principal obstáculo para la adopción de la óptica era el consumo de energía. Si se utilizaran módulos ópticos enchufables tradicionales, cada GPU Blackwell requeriría 18 módulos de 800 Gbps, lo que añadiría unos 20.000 vatios de consumo extra. No obstante, gracias a los avances en la óptica coempaquetada (CPO), los motores ópticos ahora pueden integrarse directamente junto al ASIC del switch, reduciendo drásticamente el gasto energético.
NVIDIA ha confirmado que, en sus futuros sistemas Vera Rubin NVL576 y Rosa Feynman NVL1152, adoptará una estrategia híbrida de "cobre y óptica". Ian Buck explicó que la primera capa de red seguirá utilizando cobre para mantener intacta la arquitectura de las GPU, mientras que la capa troncal (spine layer) incorporará módulos ópticos. Esta arquitectura mixta se considera la solución óptima para garantizar el máximo rendimiento evitando al mismo tiempo un desperdicio energético masivo.