LMi-MAG27 Sept - Flipbook - Page 53
prendre conscience au groupe de l’importance du travail
qu’il accomplissait. « Le HPC a un attrait limité, tandis
que l’IA suscite un intérêt et une attention généralisés »,
a-t-il déclaré. « Cela a vraiment été le plus grand changement entre le moment où nous avons commencé et celui
où nous avons publié notre spécification. »
L’importance de la spéci昀椀cation 1.0
Une version 1.0 d’une spécification indique généralement un degré de stabilité sur lequel les fournisseurs et
les intégrateurs peuvent compter. M. Metz a déclaré que,
de son point de vue, la mouture 1.0 est plus qu’une simple
version d’un document standard. Selon lui, il s’agit
d’une étape importante, car un groupe d’entreprises et
de fournisseurs a adopté une approche complète pour
synchroniser un réseau avec les exigences en matière
de charge de travail. « L’Ethernet, un réseau fantastique
et polyvalent conçu pour être aussi flexible que possible
afin de s’adapter à autant de types de charges de travail
que possible, a toujours été considéré comme insuffisant pour les charges de travail les plus exigeantes, car sa
flexibilité jouait en sa défaveur », a précisé M. Metz. « En
réalité, comme nous l’avons découvert dans le cadre de
l’UEC, il est difficile d’adapter l’Ethernet à des exigences
spécifiques en matière de charge de travail. C’est difficile, mais pas impossible. »
L’ajustement de l’Ethernet nécessite de savoir comment
et quand enfreindre les règles, en particulier au niveau
des couches réseau. M. Metz a déclaré que l’UEC résout
ce problème grâce à des normes ouvertes. Il résout les
violations de couches grâce à la coordination entre les
groupes de travail chargés des couches, et il résout le
problème lié au fait qu’il s’agit d’un protocole « entièrement nouveau » en travaillant en étroite collaboration
avec les partenaires industriels de l’écosystème (tels que
SNIA, OCP, IEEE, DMTF, NVM Express). « Il ne s’agit donc
pas seulement d’élaborer une spécification, mais plutôt
de développer un cadre à long terme permettant aux utilisateurs finaux d’avoir la certitude que le déploiement
de l’UEC n’est pas un plan d’action ponctuel et isolé », a
déclaré M. Metz.
Le contrôle de la congestion au cœur de l’UEC
Parmi les principaux domaines d’innovation de la spécification UEC 1.0 figure un mécanisme de contrôle de la
congestion du réseau, qui est essentiel pour les charges de
travail de l’IA. M. Metz a expliqué que l’approche de l’UEC
en matière de contrôle de la congestion ne repose pas sur
un réseau sans perte, comme c’était traditionnellement
le cas. Elle introduit également un mode de fonctionnement dans lequel le récepteur est capable de limiter les
transmissions de l’expéditeur, au lieu d’être passif. « C’est
essentiel pour les charges de travail de l’IA, car ces primitives permettent de construire des réseaux plus grands et
plus efficaces », a-t-il déclaré. « C’est un élément crucial
pour réduire le temps de formation et d’inférence. »
Ethernet ratrappe In昀椀niband
L’Infiniband a souvent été considéré comme supérieur
à l’Ethernet en matière de HPC et d’IA, car il offre de
meilleures performances pour ces charges de travail. A
bien des égards, l’UEC va considérablement uniformiser
les règles du jeu entre les deux rivaux. M. Metz a souligné que l’UEC adopte une approche sémantique des
charges de travail. « En résumé, cela signifie que nous
prenons la charge de travail et définissons les caractéristiques du réseau nécessaires pour optimiser la livraison
des paquets sans avoir à modifier les applications ellesmêmes », a-t-il déclaré. « L’identification des exigences
sémantiques se traduit ensuite par des ajustements du
système de livraison des paquets, qui, à leur tour, déterminent les exigences en matière de congestion, de sécurité, d’ordre de livraison, etc. »
En outre, il a expliqué que l’UEC crée un environnement
dans le réseau où les points d’extrémité de la structure ne
sont pas simplement liés au matériel dans un port NIC.
L’UEC apporte une fonctionnalité majeure qui tire parti
de tous les chemins d’un réseau. L’état n’est conservé que
tant qu’une transaction existe, ce qui réduit les besoins
en mémoire et ne nécessite pas de nouvelles infrastructures de commutation. [Lire l’intégralité de l’article sur
lemondeinformatique.fr]
APPROFONDIR
ÉCOUTER EN LIGNE
Podcast
tinyurl.com/podcast-consortium-10
LIRE EN LIGNE
Article
tinyurl.com/article-consortium-10
53