国产GPU领军企业壁仞科技日前正式发布采用7nm先进制程的高性能AI训练芯片——BR100系列。该芯片专为大规模深度学习训练场景设计,标称算力达到国际主流水平,标志着中国在高端GPU领域迈出关键一步。壁仞科技官方网站:壁仞科技官方网站。
核心功能与技术优势
壁仞7nm训练芯片基于自主架构,集成超过800亿个晶体管,支持FP32、TF32、BF16等多种精度计算。其核心优势包括:
- 超高算力密度:单芯片FP32算力超100 TFLOPS,BF16算力达2 PFLOPS,可满足千亿级参数大模型训练需求。
- 高效互联架构:支持高速SerDes和PCIe 5.0接口,多卡并行效率超过90%,大幅缩短训练周期。
- 自主软件栈:提供兼容PyTorch、TensorFlow等主流框架的BIREN AI软件平台,降低迁移成本。
应用场景与落地案例
该芯片主要面向数据中心、云计算及科研机构,重点覆盖:
- 大模型训练:支持GPT、BERT等自然语言处理模型,以及ViT等视觉大模型。
- 科学计算:用于气象模拟、药物分子动力学等HPC场景。
- 智能推理:已与多家服务器厂商联合推出训推一体方案,在智慧城市、自动驾驶等领域完成部署。
如何使用与生态支持
开发者可通过壁仞官网申请开发套件,使用BIREN AI平台完成模型适配。企业用户可联系渠道采购标准服务器或定制化集群。壁仞已与多家国产CPU、操作系统及AI框架厂商完成互认证,确保从芯片到应用的全链条自主可控。
性能评测与行业认可
根据第三方基准测试,壁仞7nm训练芯片在ResNet-50、BERT-large等典型模型上的训练吞吐量达到国际同类产品水平,功耗比优于部分竞品。该芯片已通过工信部电子第五研究所的可靠性认证,并入选多个国家级算力基础设施目录。
发表回复