Skip to content
Échelonnement des usines d’IA avec des optiques co-packagées pour une meilleure efficacité énergétique
Source: developer.nvidia.com

Échelonnement des usines d’IA avec des optiques co-packagées pour une meilleure efficacité énergétique

Sources: https://developer.nvidia.com/blog/scaling-ai-factories-with-co-packaged-optics-for-better-power-efficiency, developer.nvidia.com

TL;DR

  • Les optiques co-packagées (CPO) intègrent le moteur optique directement sur le paquet du switch, réduisant les pertes électriques et la consommation d’énergie.
  • Quantum-X Photonics et Spectrum-X Photonics remplacent les transceivers pluggables, offrant une faible latence, une grande largeur de bande et une meilleure fiabilité pour les charges d’IA.
  • La technologie permet des réseaux à haute densité et performance élevée avec jusqu’à 409,6 Tb/s de largeur de bande et 512 ports à 800 Gb/s.
  • Disponibilité prévue en plusieurs étapes : switches Quantum-X InfiniBand au début de 2026 et switches Spectrum-X Ethernet au second semestre 2026.

Contexte et arrière-plan

Alors que l’intelligence artificielle redéfinit le paysage informatique, le réseau est devenu l’épine dorsale des data centers du futur. La performance de l’entraînement des grands modèles dépend non seulement du calcul mais aussi de l’agilité, de la capacité et de l’intelligence du réseau sous-jacent. L’industrie passe d’infrastructures traditionnelles centrées sur le CPU à des usines d’IA largement coordonnées par le GPU et définies par le réseau. NVIDIA a développé une suite complète de solutions réseau — Spectrum-X Ethernet, NVIDIA Quantum InfiniBand et les plateformes BlueField — pour répondre aux exigences de bande passante élevée et de faible latence des entraînements et inférences à grande échelle. En orchestrant le calcul et la communication, le portefeuille réseau de NVIDIA vise à établir des data centers d’IA efficaces, évolutifs et résilients, où le réseau est le système nerveux central. Le blog expose comment les innovations réseau de NVIDIA permettent l’adoption des optiques co-packagées pour améliorer l’efficacité énergétique et la résilience dans les usines d’IA à grande échelle. Dans les data centers d’entreprise traditionnels, les commutateurs de niveau Tier 1 sont intégrés dans chaque rack de serveur et connectés par du cuivre direct, ce qui minimise la consommation d’énergie et la complexité des composants. Les usines modernes d’IA, avec leurs racks ultra-densos et des milliers de GPUs travaillant ensemble sur une même tâche, nécessitent une largeur de bande maximale et une latence minimale sur l’ensemble du data center. Cela conduit à des topologies où le switch Tier 1 est relégué à l’extrémité de la rangée, éloignant les serveurs des commutateurs et rendant le réseau optique essentiel. Cette évolution augmente les consommations d’énergie et le nombre de composants optiques, rendant les connexions optiques nécessaires à la fois NIC-to-switch et switch-to-switch. Les commutateurs traditionnels utilisant des transceivers enfichables reposent sur plusieurs interfaces électriques; le signal doit parcourir des chemins électriques longs du ASIC du switch vers le PCB, les connecteurs et enfin le transcepteur externe avant d’être converti en signal optique. Ce parcours fragmenté engendre des pertes électriques substantielles (jusqu’à environ 22 dB pour des canaux à 200 Gb/s), ce qui accroît la puissance et la chaleur, et multiplie les points de défaillance. En revanche, les commutateurs avec optiques co-packagées intègrent la conversion électro-optique directement sur le package du switch, réduisant les pertes électriques à environ 4 dB et abaissant la consommation à seulement 9W par interface. Cette conception rationalise le trajet du signal et améliore l’intégrité, la fiabilité et l’efficacité énergétique — indispensables pour les déploiements IA à haute densité. NVIDIA a conçu des systèmes basés sur CPO pour répondre à des exigences sans précédent des usines d’IA. En intégrant les moteurs optiques directement sur l’ASIC du switch, les nouvelles offres Quantum-X Photonics et Spectrum-X Photonics remplacent les transceivers traditionnels et optimisent le trajet du signal pour des performances, une efficacité et une fiabilité accrus. Ces innovations ouvrent de nouveaux records en matière de bande passante et de densité de ports, tout en modifiant l’économie et la conception physique des data centers IA. L’intégration de la photonik dans les composants réseau permet des interconnexions massives adaptées aux charges d’IA basées sur des agents.

Ce qui est nouveau

  • Les optiques co-packagées (CPO) intègrent le moteur optique directement sur le paquet du switch, réduisant drastiquement les pertes électriques et la consommation par interface par rapport aux solutions traditionnelles à transceivers enfichables.
  • Quantum-X Photonics InfiniBand étend la technologie des switches InfiniBand avec photoniques intégrés, offrant une latence ultra-basse, une largeur de bande inégalée et une résilience opérationnelle améliorée.
  • Spectrum-X Photonics étend l’approche CPO au switch Ethernet, conçu pour les charges IA génératives et les entraînements/inférences à grande échelle. Ces switches Spectrum-X Photonics sont proposés dans deux variantes de châssis liquides basés sur l’ASIC Spectrum‑6 et alimentés par la photoniques en silicium NVIDIA, réduisant le nombre de composants discrets et les interfaces électriques.
  • L’objectif est une efficacité énergétique accrue (prévu ~3,5x) et une résilience améliorée (~10x) grâce à la réduction des composants optiques susceptibles de tomber en panne.
  • Le design optique simplifie le chemin du signal et améliore la fiabilité et la maintenabilité, avec des déploiements plus rapides pour les charges IA.
  • La largeur de bande et la densité de ports élevées restent une priorité, avec une capacité allant jusqu’à 409,6 Tb/s et 512 ports à 800 Gb/s.
  • NVIDIA met en évidence deux variantes Spectrum-X : une à ASIC unique (SN6810) et une autre à ASICs multiples (SN6800) avec réorganisation intégrée des fibres, montrant comment plusieurs ASICs peuvent être combinés pour des réseaux denses dans les installations IA.
  • Disponibilité commerciale prévue pour le début de 2026 pour les switches Quantum-X InfiniBand et pour le second semestre 2026 pour les switches Spectrum-X Ethernet, reflétant une mise en marché en étapes coordonnée avec les cycles d’adoption des entreprises.
Métrique / CapacitéValeur / Déclaration
Perte électrique avec CPO~4 dB
Puissance par interfacejusqu’à 9W
Largeur de bande potentiellejusqu’à 409,6 Tb/s
Ports à 800 Gb/sjusqu’à 512
Amélioration de l’efficacité énergétique vs avant~3,5x
Amélioration de la résilience~10x
Disponibilité InfiniBandDébut 2026
Disponibilité Ethernet Spectrum-X2e moitié 2026
Pourquoi ce changement compte pour les charges IA : Les optiques co-packagées simplifient le chemin du signal, améliorent la fiabilité et réduisent la consommation d’énergie dans les environnements à haute densité requis par les usines IA. En rapprochant l’optique du ASIC du switch, NVIDIA diminue le nombre d’interfaces électriques et les pertes associées, permettant une densité d’interconnexion plus élevée sans augmenter proportionnellement l’énergie ou la chaleur.

Pourquoi cela compte pour les développeurs et les entreprises

  • Une plus grande largeur de bande et une latence plus faible permettent des entraînements et inférences plus rapides pour les gros modèles IA.
  • Une résilience accrue réduit les coûts de maintenance et le risque d’indisponibilité dans les déploiements à grande échelle où les défaillances des composants optiques peuvent impacter le débit et la disponibilité.
  • Une meilleure maintenabilité et des chemins de signal plus simples peuvent raccourcir les cycles de déploiement et réduire le coût total de possession dans les data centers hyperscales.
  • Le passage à des optiques co-packagées indique une évolution des architectures data center orientées IA, où les réseaux s’intègrent plus étroitement au compute.
  • Les châssis liquides Spectrum-X sont conçus pour les environnements à forte densité et consommation énergétique, typiques des installations IA.

Détails techniques ou Mise en œuvre

  • Les optiques co-packagées placent le moteur optique directement sur l’ASIC du switch, connectant la fibre directement au moteur optique adjacent au silicium, éliminant plusieurs interfaces électriques qui introduisent des pertes et de la consommation.
  • Dans les architectures traditionnelles, la perte électrique peut atteindre ~22 dB pour des canaux de 200 Gb/s, entraînant une consommation accrue. Le design CPO réduit cette perte à ~4 dB et la consommation à ~9W par interface.
  • Quantum-X Photonics et Spectrum-X Photonics remplacent les transceivers traditionnels et soutiennent les charges IA de grande échelle, incluant les IA basées sur des agents.
  • Spectrum-X Photonics cible Ethernet et propose des châssis liquides (SN6810 ASIC unique et SN6800 quadric ASIC avec réorganisation des fibres) pour réduire les composants discrets et les interfaces électriques.
  • La disponibilité est planifiée pour début 2026 (InfiniBand) et seconde moitié de 2026 (Ethernet), marquant une sortie en phases.

FAQ

  • Q: Qu’est-ce que les optiques co-packagées (CPO) dans les équipements réseau NVIDIA ? A: CPO intègre le moteur optique directement dans le package du switch, réduisant les pertes électriques et la consommation par rapport aux solutions à transceivers enfichables.
  • Q: Quels produits se rattachent à cette approche ? A: Quantum-X Photonics (InfiniBand) et Spectrum-X Photonics (Ethernet), des switches qui remplacent les transceivers hérités par des moteurs optiques intégrés.
  • Q: Quand ces produits seront-ils commercialisés ? A: Quantum-X InfiniBand prévu pour début 2026 et Spectrum-X Ethernet prévu pour le second semestre 2026.
  • Q: Quels gains de performance sont annoncés ? A: Amélioration d’environ 3,5x de l’efficacité énergétique, amélioration d’environ 10x de la résilience et une largeur de bande élevée avec densité de ports importante (jusqu’à 409,6 Tb/s et 512 ports à 800 Gb/s).
  • Q: Pourquoi cette architecture est-elle importante pour les usines IA ? A: Elle prend en charge des interconnexions extrêmement denses et à faible latence pour l’entraînement et l’inférence à grande échelle, tout en réduisant les points de défaillance et la maintenance.

References

More news