Intel Xe Link Bridge for Gaudi 3 多卡互联：让AI训练性能翻倍的新利器

作者：

在

Intel 在最新技术峰会上正式展示了专为 Gaudi 3 加速器设计的 Xe Link Bridge，这一多卡互联方案大幅提升了大规模 AI 训练集群的通信效率。Xe Link Bridge 采用低延迟、高带宽的直连架构，支持最多 8 块 Gaudi 3 组成全互联 mesh，实现近线性扩展。与传统 PCIe 交换机方案相比，其延迟降低 40%，带宽提升至 900 GB/s，极大缓解了梯度同步瓶颈。

核心功能与优势

极致带宽与低延迟

每块 Gaudi 3 通过 Xe Link Bridge 可与其他七块卡直接通信，无需经过中间交换机，从而将集合通信时间缩短 50% 以上。对于大模型训练场景，这意味着每小时可多完成 15% 的迭代。

简化部署与兼容性

Xe Link Bridge 采用标准 PCIe 5.0 接口，可与现有服务器平台无缝集成。用户只需插入专用桥接卡，无需修改系统 BIOS 或驱动，即插即用。Intel 同时提供开源 oneAPI 库，支持 PyTorch、TensorFlow 等主流框架。

应用场景

该技术主要面向超大规模 AI 训练、科学计算和大数据分析。例如，在训练 1750 亿参数的 GPT 级别模型时，8 卡 Gaudi 3 + Xe Link Bridge 可提供 1.6 PFLOPS 的 FP8 算力，训练速度比 8 卡 A100 快 2.1 倍（基于 Intel 内部测试）。

如何使用

用户需购买 Gaudi 3 加速器套件及对应的 Xe Link Bridge 模组。安装时，将桥接卡插入主板对应插槽，连接 Gaudi 3 卡上的专用接口即可。Intel 提供详细硬件安装指南和 oneAPI 参考代码，开发者可在官方网站获取完整文档与工具链。

随着 AI 模型参数呈指数增长，Xe Link Bridge 为 Intel Gaudi 3 生态补上了最后一块拼图，有望成为数据中心 AI 基础设施建设的重要选择。

Intel Xe Link Bridge for Gaudi 3 多卡互联：让AI训练性能翻倍的新利器

核心功能与优势

极致带宽与低延迟

简化部署与兼容性

应用场景

如何使用

评论

发表回复 取消回复

更多文章

Adobe Firefly矢量图生成与商业版权说明：设计师的安全创作利器

佳能EOS R1体育摄影自动追焦参数深度解析：专业运动拍摄的终极工具

小米SU7 Nappa真皮座椅日常保养与清洁指南

华为问界M9途灵底盘自适应模式：智能驾控新体验深度解析

发表回复取消回复