Intel 最新发布的 Gaudi 3 AI 加速器凭借其卓越的能效比和开放生态,正在重塑高性能计算市场。据最新评测,通过优化软件栈与硬件协同调度,Gaudi 3 在大型语言模型推理任务中实现了 30% 的吞吐量提升。该加速器采用 5nm 工艺,集成 128GB HBM2e 内存,其专用的矩阵乘法引擎在大规模并行训练中展现出显著优势。
在性能调优方面,Intel 提供了开源工具套件,包括定制化的编译器、内核融合以及自动混合精度支持,帮助开发者在 PyTorch 和 TensorFlow 环境中快速达到最佳性能。多家云服务商已将其部署于推理集群,用于生成式 AI 和推荐系统。
更多详情及官方 SDK 下载,请访问 Intel Gaudi 3 官方网站。