高性能网络与路由算法从零到一:InfiniBand、RoCEv2、ECMP vs SPF vs 自适应路由
系统讲解 InfiniBand、RoCEv2 底层架构,深入对比 SPF、ECMP 与自适应路由算法,涵盖 L3 vs L4 路由、RoCEv2 vs InfiniBand 路由机制深度对比,并揭示路由协议设计背后的反应式哲学。
阅读更多系统讲解 InfiniBand、RoCEv2 底层架构,深入对比 SPF、ECMP 与自适应路由算法,涵盖 L3 vs L4 路由、RoCEv2 vs InfiniBand 路由机制深度对比,并揭示路由协议设计背后的反应式哲学。
阅读更多在 GPU 分布式训练中,HPC-X、UCX、PMIx、NCCL 各层职责极为清晰。本文从调用链角度深度解析每个组件的边界——HPC-X 在 ncclCommInitRank 完成后就退出关键路径,NCCL 热路径完全由 GPU kernel 驱动,CPU 不参与。
阅读更多