AI相互接続技術の覇権争い:NVLink、InfiniBand、UALink、そしてAIの頂点を目指す戦い
人工知能(AI)とハイパフォーマンスコンピューティング(HPC)の最先端領域において、性能のボトルネックはもはやプロセッサの生の計算能力から、これらの強力な計算ユニットを接続する複雑な高速ネットワーク、すなわち相互接続技術へと移行して久しいです。私たちの最近の深掘り調査は、NVLink、InfiniBand、UALink、Ultra Ethernetといった技術が織りなす、競争と相互補完の魅力的な世界を明らかにしました。この記事では、私たちの主要な発見を体系的に整理し、これらの重要な技術の全体像を提示します。
第一章:四人の主役——AIネットワーキングの礎
技術的な詳細に立ち入る前に、まずこの壮大なドラマの主役たちを紹介しましょう:
- NVLink & NVSwitch: NVIDIAの切り札であり、GPU間の高速・短距離通信のための独自の相互接続技術。
- InfiniBand: HPCおよびAI分野で実績のある高性能相互接続標準であり、その超低遅延と高スループットで知られています。
- Ultra Ethernet (UEC): Ethernet陣営の革命的な回答であり、InfiniBandレベルの性能を遍在するEthernetエコシステムにもたらすことを目指しています。
- UALink (Ultra Accelerator Link): ノード内のAIアクセラレータを接続するためのオープンスタンダードであり、NVLinkの直接の挑戦者と見なされています。
第二章:スケールアップ vs. スケールアウト——二つの拡張次元
これらの技術を理解するための最初の鍵は、スケールアップとスケールアウトという二つの異なる拡張次元を区別することにあります。
| 相互接続技術 | 拡張タイプ | 主要な応用シナリオ |
|---|---|---|
| NVLink / NVSwitch | スケールアップ(ノード内) | 単一のサーバーまたは計算ノード内で複数のGPUを緊密に接続し、強力な計算ユニットを形成する。 |
| UALink | スケールアップ(ノード内) | ノード内の複数のAIアクセラレータを接続し、統一されたメモリプールを構築する。 |
| InfiniBand | スケールアウト(ノード間) | 数千のサーバーノードを接続し、大規模なAIトレーニングおよびHPCクラスタを構築する。 |
| Ultra Ethernet | スケールアウト(ノード間) | 同様に大規模ノードの接続に使用されるが、Ethernet上でAI/HPCに必要な高性能を達成することに焦点を当てている。 |
第三章:信頼性の論争——なぜ従来のIPネットワークは不十分なのか
私たちの議論から得られた最も深遠な発見の一つは、従来のIPネットワークと専門的な相互接続技術との間の信頼性設計哲学の根本的な違いです。
従来のEthernet/IP:ベストエフォート
IPネットワークの核心設計は「ベストエフォート」であり、データパケットが必ず到着することを保証しません。ネットワークが混雑し、ルーターのバッファが満杯になると、パケットを直接ドロップすることを選択します。信頼性は完全に上位層のTCPプロトコルに委ねられ、TCPはソフトウェア(オペレーティングシステムのカーネル)で複雑なパケット損失検出と再送を実行します。この設計の代償は以下の通りです:
- 高遅延: TCPの再送はミリ秒(ms)単位であり、マイクロ秒(μs)レベルの同期を必要とするAIトレーニングにとっては致命的です。
- 高いCPUオーバーヘッド: カーネルプロトコルスタックの処理は、貴重なCPUリソースを消費します。
- 予測不可能な性能: パケット損失率と遅延は、ネットワーク負荷によって劇的に変動します。
InfiniBand & NVLink:ロスレスネットワーク
対照的に、InfiniBandとNVLinkは「ロスレスネットワーク」として設計されており、ハードウェアメカニズムを通じてパケット損失を根本的に回避します。
核心メカニズム:クレジットベースのフロー制御(CBFC)
これは予防的な輻輳管理技術です。データを送信する前に、送信者はまず受信者から「クレジット」を取得しなければなりません。各クレジットは受信者側の利用可能なバッファを表します。クレジットがなければ、データは一切送信されません。これは、「ウサギを見るまでタカを放たない」システムのようなもので、受信側のバッファスペース不足によるデータパケットのドロップを決코して起こさせません。
このハードウェアレベルの信頼性保証は、マイクロ秒あるいはサブマイクロ秒の遅延とほぼゼロのCPUオーバーヘッドを提供し、AI/HPCに安定した予測可能な性能基盤を提供します。
第四章:Ultra Ethernet——Ethernetの「超進化」
Ultra Ethernetは、InfiniBandの利点をEthernetエコシステムに移植することを目指しています。これは、全く新しいプロトコルスタック(UET)を通じてこの目標を達成し、その核心的な革新には以下が含まれます:
- マルチパスルーティングとパケットスプレイング: 単一のデータストリームを複数のネットワークパスに分散させることで、ネットワーク利用率と実効帯域幅を大幅に向上させます。
- 柔軟な順序付き転送: ある程度の順序外パケット配信を許容してネットワークパスを最適化し、受信側で再順序付けを行ってアプリケーション層でのデータの正確性を保証します。
- 高度な輻輳制御: 従来のPFC(Priority Flow Control)よりも洗練された輻輳管理メカニズムを導入し、ヘッドオブラインブロッキングなどの問題を回避します。
第五章:NVIDIAの統一アーキテクチャ——エンジニアリングの驚異
私たちの議論で最も驚くべき部分は、NVIDIAがその3つの主要なスイッチ製品ライン——NVSwitch、Quantum(InfiniBand)、Spectrum(Ethernet)——にわたって実装した「統一アーキテクチャ」でした。
「共有IPブロック」の真実
ここでの「IP」はインターネットプロトコルを指すのではなく、知的財産(Intellectual Property)を指します。半導体設計の分野では、IPブロックまたはIPコアとは、再利用可能な、事前に設計された回路機能モジュールを指します。NVIDIAの統一アーキテクチャは、まさにこれらの成熟したIPブロックを異なるチップで再利用することによって達成されています。
統一アーキテクチャの三つの階層
- NVSwitch ↔ Quantum IB(コントロールプレーンの共有): 第4世代のNVSwitchは、トポロジ発見、ルーティング計算、パーティション管理ロジックなど、InfiniBandスイッチと多数のコントロールプレーンIPブロックを共有しています。その核心的な管理サービスであるNVLSM(NVLink Subnet Manager)は、IB Subnet Managerから進化しました。
- Quantum IB ↔ Spectrum Ethernet(物理層とリンク層の共有): これら二つは、基盤となるSerDes技術、シリコンフォトニクス統合(CPO)技術、さらには製造およびパッケージングパートナーを共有しています。
- 統一された管理プレーンの概念: 管理ツールは別々ですが、同様の管理概念(LID、PKEYなど)とアーキテクチャを共有しており、ユーザーの学習および管理コストを大幅に削減します。
興味深い発見:なぜSpectrumスイッチはQuantumスイッチの2倍のトランジスタを持つのか?
NVIDIAのネットワーキング責任者によると、Spectrum-4スイッチはQuantum-2の2倍以上のトランジスタを持っています。その理由は、Ethernetが分散ルーティングプロトコル(BGP/OSPFなど)をサポートする必要があり、この複雑なルーティング計算ロジックをスイッチチップ内に実装しなければならないためです。対照的に、InfiniBandは集中ルーティングを使用し、ルーティング計算は外部のサブネットマネージャ(SM)によって実行されます。スイッチ自体は単純なテーブルルックアップと転送を行うだけで済むため、チップ設計がよりシンプルになります。
第六章:誤解の解明——Fabric Manager vs. UFM
一般的な誤解は、Fabric ManagerがすべてのNVIDIAネットワークを統一的に管理できるというものです。実際の状況は次のとおりです:
| 管理ツール | 管理対象 | スコープ |
|---|---|---|
| Fabric Manager (FM) + NVLSM | NVLinkとNVSwitch | ノード内 |
| UFM (Unified Fabric Manager) | InfiniBandネットワーク | データセンタースケール |
「統一」とは、基盤となるアーキテクチャと設計哲学を指し、単一の管理ソフトウェアを指すものではありません。これは、明確な責任を持つ階層化された管理システムです。
第七章:RoCEv2のUDP「偽装」
私たちの議論では、RoCEv2(RDMA over Converged Ethernet)の巧妙な設計も明らかにしました:なぜInfiniBandトランスポート層の上にUDPヘッダをカプセル化する必要があるのでしょうか?
答えは、ここでのUDPはトランスポート層の役割を果たすのではなく、「ステートレスなカプセル化層」として機能するからです。これは「偽装」として機能し、IBデータパケットを標準のUDPパケットにラップして、既存のIPネットワークデバイス上でそれらのデバイスに変更を加えることなくルーティングできるようにします。UDPヘッダのソースポート番号も、ECMP(Equal-Cost Multi-Path)負荷分散を実装するために巧妙に使用されます。実際の信頼性の高い転送、輻輳制御、その他の機能は、内部にカプセル化されたInfiniBandトランスポート層によって引き続き処理されます。
第八章:新たな挑戦者——ファーウェイの統一バス
NVIDIAの独自エコシステムとオープンスタンダードアライアンスとの間の戦いが激化する中、新たな野心的な挑戦者が現れました:ファーウェイの統一バス(UB)とそのUB-Meshアーキテクチャです。Hot Chips 2025で発表されたこの技術は、PCIeやNVLinkからTCP/IPやRoCEに至るまで、相互接続のアルファベットスープ全体を単一の統一プロトコルで置き換えるという急進的なビジョンを表しています。
すべてを支配する一つのプロトコル
ファーウェイの核心的なアイデアは、単一のプロトコルを作成することで、どのポートもプロトコル変換なしに他のどのポートとも通信できるようになるというものです。このアプローチは、特にファーウェイが「スーパーノード」と呼ぶ大規模なギガワット級のAIデータセンターの文脈で、遅延を劇的に削減し、コストを制御し、信頼性を向上させることを目指しています。そのビジョンは、データセンター全体をUB-Meshで接続された単一のコヒーレントなシステムに変えることです。
統一バスの主要な技術的野心:
- スケール: 最大1,000,000個のプロセッサ(CPU、GPU、NPU)を単一のスーパーノードに統一することを目指しています。
- 帯域幅: チップあたりの帯域幅を100 Gbpsから驚異的な10 Tbps(1.25 TB/s)にスケーリングすることを目指しています。
- 遅延: ホップ遅延をマイクロ秒から約150ナノ秒に削減することを目標としています。
- セマンティクス: 従来のネットワークの非同期DMAモデルから、NVLinkに似た同期ロード/ストアモデルに移行し、より効率的なデータアクセスを実現します。
- 信頼性: 光パス上のリンクレベルの再試行からシステムレベルの回復力のためのホットスペアラックまで、スタックのすべての層で信頼性を実装し、平均故障間隔(MTBF)を100倍向上させることを目標としています。
地政学的状況における戦略的動き
ファーウェイが全く新しいオープンソースの相互接続標準を推進することは、地政学的な状況と半導体制裁への戦略的な対応でもあります。国産のオープンスタンダードを作成することで、ファーウェイは西側技術への依存を減らし、自給自足のAIエコシステムを構築することを目指しています。これにより、統一バスはNVLink、UALink、Ultra Ethernetの技術的な競争相手であるだけでなく、世界的な技術競争における重要なプレーヤーにもなります。
結論:相互接続技術の「戦国時代」
AIおよびHPC相互接続の分野は、エキサイティングな「戦国時代」に突入しています。NVIDIAは、高度に垂直統合されたNVLink+InfiniBandエコシステムと統一アーキテクチャにより、手ごわい技術的障壁を築いています。同時に、Ultra EthernetとUALinkに代表されるオープンスタンダード陣営は、広大なEthernetエコシステムを活用して強力な挑戦を仕掛けています。そして今、ファーウェイの統一バスがその包括的なビジョンとオープンソース戦略で参入し、競争はさらに複雑で魅力的なものになっています。
このコンテストに絶対的な勝者はいません。異なる技術的パスは、それぞれの得意分野で進化し続けるでしょう。しかし、一つ確かなことは、この激しい競争こそが、業界全体を前例のないペースで前進させ、次世代の超知能システムの誕生への道を切り開いているということです。