Skip to content
Decorative image.
Source: developer.nvidia.com

Maximiser les réseaux à faible latence pour les services financiers avec NVIDIA Rivermax et NEIO FastSocket

Sources: https://developer.nvidia.com/blog/maximizing-low-latency-networking-performance-for-financial-services-with-nvidia-rivermax-and-neio-fastsocket, https://developer.nvidia.com/blog/maximizing-low-latency-networking-performance-for-financial-services-with-nvidia-rivermax-and-neio-fastsocket/, NVIDIA Dev Blog

TL;DR

  • Rivermax fournit une bibliothèque logiciel IP optimisée et multiplateforme offrant un débit élevé, un pacing précis et une faible latence avec une faible utilisation du CPU pour les flux de données.
  • FastSockets d’NEIO étend Rivermax avec des techniques de contournement du noyau (kernel bypass) pour des communications UDP/TCP sans pertes perceptibles, permettant aux données d’un NIC d’aller directement vers l’application et réduisant latence et sérialisation.
  • Avec les adaptateurs NVIDIA ConnectX, FastSockets permet des chemins sans copie (zero‑copy) et un pacing matériel, offrant des taux de paquets plus élevés et une latence plus faible que les sockets traditionnels ou le RIO dans ce cadre.
  • Le GPUDirect complète cette pile en permettant un accès direct mémoire NIC↔GPU, réduisant la latence et facilitant l’inférence IA en temps réel sur les flux de données de marché sans surcharge CPU.
  • Ensemble, ces technologies visent des domaines sensibles à la latence tels que le trading algorithmique, le streaming en temps réel et les pipelines IA, tout en notant que UDP n’assure pas la fiabilité et nécessite une gestion des pertes au niveau applicatif.

Contexte et antécédents

La latence ultra‑faible et la livraison fiable des paquets sont des exigences clés pour les applications modernes dans des secteurs comme les services financiers, les jeux en nuage et les flux média. À ces domaines, des microsecondes d’avance ou un seul paquet perdu peuvent avoir des conséquences significatives. Les piles réseau traditionnelles peinent à maintenir un débit en ligne et une latence faibles à mesure que les vitesses réseau atteignent 10/25/50/100/200 GbE ou plus. NVIDIA Rivermax est décrit comme une bibliothèque logicielle IP cross‑platform hautement optimisée pour les flux média et les données, tirant parti du calcul accéléré par GPU et de NICs performants pour atteindre un débit élevé, un repérage précis dans le hardware, une latence minimale et une faible utilisation du CPU. L’objectif est de maintenir les données efficaces lorsque les vitesses augmentent, en évitant les goulets d’étranglement du noyau. FastSockets d’NEIO Systems est une bibliothèque middleware axée sur UDP et TCP performants, avec une emphase sur la technologie « dropless » pour une latence minimale et une bande passante élevée. Lorsqu’elle est associée aux adaptateurs NVIDIA ConnectX, FastSockets exploite les technologies Rivermax pour permettre le contournement du noyau et livrer les données directement du NIC vers l’application, réduisant ainsi latence et taux de paquets. Dans les applications modernes, l’UDP est privilégié pour les transferts de données à faible latence (par exemple, le streaming vidéo en vision par ordinateur et la distribution en temps réel des données de marché), car il ne fournit pas de mécanismes de récupération intégrés et nécessite une gestion côté application des pertes de paquets. Cette approche de bas niveau vise également GPUDirect, qui permet un accès mémoire direct NIC↔GPU, contournant le CPU et réduisant les délais PCIe. Les modèles IA déployés pour ces cas d’usage sont optimisés pour une inférence ultra‑faible directement sur les GPU, en utilisant ONNX, TensorRT et CUDA, avec des modèles distillés et quantifiés pour la taille et la latence minimales. L’intégration Rivermax + GPUDirect favorise un flux zero‑copy du flux réseau vers la mémoire GPU, accélérant les décisions de cotation en période de volatilité.

Nouvelles caractéristiques

L’intégration Rivermax + FastSockets pousse la latence et le throughput à des niveaux adaptés aux charges réseau actuelles. Points clés:

  • Contournement du noyau: les données entrent directement dans les buffers de l’application, évitant les copies dans le noyau et réduisant la sérialisation.
  • Réception UDP sans pertes: le chemin FastSockets minimise les retards dus à la retransmission et à la récupération de paquets, essentiel pour les flux de marché et les pipelines en temps réel.
  • Débit et cadence matériels: Rivermax offre un pacing des paquets dans le hardware, permettant un débit soutenu à vitesse de ligne; les sockets traditionnels ne tiennent pas le rythme à haute vitesse et les benchmarks RIO restent limités dans ce contexte.
  • GPUDirect: l’accès direct NIC↔GPU réduit les délais et permet l’ingestion des données de marché en mémoire GPU pour une inférence IA quasi instantanée.
  • IA et streaming: les modèles IA pour l’inférence en temps réel utilisent ONNX, TensorRT et CUDA, avec des techniques de distillation et quantification pour optimiser taille et latence. Contexte IA
  • Plateformes: FastSockets est disponible pour Linux et Windows; les résultats Windows mettent en évidence des avantages particuliers dans les déploiements Rivermax avec adapters ConnectX. Notes de plateforme

Pourquoi cela compte (impact pour les développeurs/entreprises)

Pour les équipes axées sur les charges sensibles à la latence, Rivermax + FastSockets offre une voie pratique pour réduire le chemin des données tout en maintenant ou augmentant le débit. Dans le trading algorithmique, chaque microseconde compte; la donnée arrivant en mémoire GPU via GPUDirect permet d’exécuter des IA sur des flux de marché en quasi‑temps réel, ce qui peut améliorer les décisions de cotation et les contrôles de risque. Dans les pipelines de vision, la perte de paquets peut entraîner des artefacts ou des retards; une voie UDP sans pertes associée à un chemin rapide réduit ces risques. Pour les flux médiatiques, cette approche aide à maintenir des streams de haute qualité même sous charge réseau. En entreprise, la combinaison offre une base logicielle orientée hardware qui combine les capacités du NIC, le contournement du noyau et l’accélération GPU pour réduire les coûts CPU et accéder à l’IA en temps réel.

Détails techniques ou Mise en œuvre

  • Rivermax est une bibliothèque logicielle IP‑based cross‑platform, optimisée pour les flux média et les données, tirant parti du calcul GPU et des NIC hautes performances pour atteindre un débit élevé, un pacing matériel, une latence minimale et une faible utilisation CPU. Cette architecture vise à éviter les goulets d’étranglement du noyau lorsque les vitesses réseau augmentent. Description Rivermax
  • FastSockets d’NEIO est une bibliothèque middleware pour UDP/TCP haute performance, axée sur une livraison sans perte et une bande passante élevée, intégrée à Rivermax via les adaptateurs ConnectX Nvidia. Vue d’ensemble FastSockets
  • Contournement du noyau et zero‑copy: Rivermax dépose les données directement dans les buffers de l’application, éliminant les copies en mode noyau et permettant des buffers dynamiques, ce qui réduit la sérialisation et augmente les débits soutenus.
  • Réception UDP sans pertes: le flux UDP de FastSockets minimise les délais liés aux pertes et retransmissions, tout en préservant les garanties propres à l’application.
  • GPUDirect: accès mémoire direct NIC↔GPU réduisant CPU et PCIe pour l’acheminement des données vers la mémoire GPU afin d’accélérer l’inférence IA. Contexte GPUDirect
  • Plates‑formes et portée: FastSockets est disponible sous Linux et Windows; les résultats Windows démontrent des avantages spécifiques dans les configurations Rivermax avec ConnectX; le RIO est noté comme limité pour une évaluation approfondie dans ce contexte. Notes de plateforme
  • IA et inference: les modèles IA pour trading utilisent ONNX, TensorRT et CUDA, avec des techniques de distillation et quantification afin de réduire latence et taille du modèle; le flux de données réseau vers la mémoire GPU permet une inférence quasi instantanée sur des flux de données de marché. Cadre IA

Points clés

  • Rivermax + FastSockets offrent un chemin réseau de hautes performances avec latence ultra‑faible et throughput élevé grâce au bypass du noyau et au mouvement des données sans copie vers la mémoire de l’application.
  • Cette approche réduit le coût CPU et améliore les taux de paquets, surpassant les sockets traditionnels et le RIO dans le cadre étudié.
  • GPUDirect permet un flux NIC↔GPU direct, ouvrant la voie à l’inférence IA en temps réel sur les flux de marché sans surcharge CPU/PCIe.
  • UDP demeure utile pour les flux à latence faible, mais nécessite une gestion d’éventuelles pertes par l’application pour atteindre les objectifs de latence.
  • Le tout couvre Linux et Windows, avec des bénéfices particuliers sous Windows via Rivermax et ConnectX.

FAQ

  • Qu’est‑ce que Rivermax ?

    Rivermax est une bibliothèque logicielle optimisée pour les flux média et données, conçue pour délivrer un débit élevé, un pacing matériel, une latence minimale et une faible utilisation CPU. [Description Rivermax](https://developer.nvidia.com/blog/maximizing-low-latency-networking-performance-for-financial-services-with-nvidia-rivermax-and-neio-fastsocket/)

  • u’est‑ce que FastSockets ?

    FastSockets est une bibliothèque middleware pour UDP/TCP haute performance, axée sur une livraison sans pertes et une faible latence, intégrée à Rivermax via ConnectX. [Vue d’ensemble FastSockets](https://developer.nvidia.com/blog/maximizing-low-latency-networking-performance-for-financial-services-with-nvidia-rivermax-and-neio-fastsocket/)

  • Comment le GPUDirect s’intègre‑t‑il ?

    GPUDirect autorise un accès mémoire direct NIC↔GPU, réduisant la latence et permettant une ingestion des données de marché en mémoire GPU pour une inférence IA rapide. [GPUDirect](https://developer.nvidia.com/blog/maximizing-low-latency-networking-performance-for-financial-services-with-nvidia-rivermax-and-neio-fastsocket/)

  • uelles plates‑formes sont supportées ?

    FastSockets est disponible sur Linux et Windows; les résultats Windows mettent en valeur les bénéfices de Rivermax avec des adaptateurs ConnectX; les benchmarks RIO sont limités ici. [Notes de plateforme](https://developer.nvidia.com/blog/maximizing-low-latency-networking-performance-for-financial-services-with-nvidia-rivermax-and-neio-fastsocket/)

  • Pourquoi utiliser UDP si ce dernier n’assure pas la fiabilité ?

    UDP offre une latence faible et un overhead minimal; l’application peut gérer les pertes selon le contexte tout en bénéficiant d’un chemin de données rapide. [Caractéristiques UDP](https://developer.nvidia.com/blog/maximizing-low-latency-networking-performance-for-financial-services-with-nvidia-rivermax-and-neio-fastsocket/)

Références

More news