ab123

标签： AI芯片

英特尔发布 Gaudi 3 AI 芯片，挑战英伟达
英特尔近日正式发布了新一代 AI 加速芯片 Gaudi 3，旨在与英伟达在人工智能计算领域展开正面竞争。这款芯片基于先进制程工艺，专为大规模训练和推理任务优化，标志着英特尔在 AI 硬件市场的重要布局。

产品核心功能

Gaudi 3 芯片集成了高性能张量处理核心，支持 FP8、BF16 等多种精度计算，能够显著加速深度学习模型训练。其内置的高带宽内存和高速互联架构，可有效降低数据搬运延迟，提升整体计算效率。

关键性能指标
- 算力密度：相较上一代提升约 2 倍
- 内存带宽：高达 3.6 TB/s
- 能效比：每瓦性能提升 40%
应用场景与优势

Gaudi 3 主要面向云服务商、企业级数据中心以及科研机构，适用于大语言模型训练、图像识别、推荐系统等场景。其开放的软件栈兼容 PyTorch 和 TensorFlow，降低了开发者迁移成本。

相比竞品的关键优势
- 更低的总拥有成本（TCO）
- 原生支持以太网互联，无需专用网络
- 提供灵活的规模化部署方案
如何使用与生态支持

开发者可通过英特尔 OneAPI 工具链以及 Habana SynapseAI 软件开发套件快速接入 Gaudi 3。英特尔已与多家主流云平台合作，提供按需算力服务。企业可联系官方获取评估套件和参考设计。

更多产品详情，请访问英特尔官方网站：英特尔官方网站
2026年6月9日
英特尔发布Gaudi 3 AI芯片，正面挑战英伟达霸主地位
近日，英特尔正式发布了新一代AI加速芯片Gaudi 3，这款产品专为大规模生成式AI训练和推理设计，目标直指英伟达的H100和B200系列。Gaudi 3采用先进的制程工艺和异构计算架构，在能效比和开放性上形成独特优势。更多产品信息请访问：英特尔Gaudi 3官方网站。

核心功能与性能突破

Gaudi 3集成了专用的矩阵乘法引擎和大容量高带宽内存（HBM3e），单芯片FP8算力达到数PetaFLOPS级别。与英伟达同类产品相比，Gaudi 3在LLM（大语言模型）推理任务中的每瓦性能提升了约30%，并支持8192以上的序列长度处理。

异构计算与开放生态

英特尔强调Gaudi 3完全兼容PyTorch、TensorFlow等主流框架，并通过OneAPI统一编程模型降低迁移成本。开发者无需依赖CUDA独占生态，即可快速部署模型。此外，Gaudi 3支持以太网互联，可构建数千节点的集群，特别适合云服务商和超大规模数据中心。

主要优势：性价比与能效

相较于英伟达高达数万美元的单卡成本，Gaudi 3在同等训练吞吐下可降低约40%的总体拥有成本（TCO）。在能效方面，其液冷设计使得PUE（电能使用效率）低于1.1，为绿色AI提供硬件基础。

实际应用场景

目前Gaudi 3已在多个头部互联网企业完成部署测试，涵盖智能客服、代码生成、多模态搜索等场景。英特尔表示，该芯片已被微软Azure、阿里云等主流云平台采纳，预计下半年将大规模商用。

如何使用与开发入门

开发者可通过英特尔开发者云（Intel Developer Cloud）申请Gaudi 3实例，获取免费试算额度。使用步骤包括：选择加速实例类型、配置PyTorch环境、加载预训练模型。英特尔官方提供了丰富的文档和示例代码，帮助用户快速完成迁移。
- 通过OneAPI安装套件配置开发环境
- 利用Habana SynapseAI软件栈进行神经网络编译和优化
- 使用Gaudi Hub获取针对该芯片优化的预训练模型
随着Gaudi 3的正式出货，AI芯片市场有望打破英伟达一家独大的格局，推动整个行业向更开放、更低成本的方向演进。
2026年6月9日
英伟达CEO黄仁勋宣布新一代AI芯片性能提升20倍

在近日于美国圣何塞举办的GTC 2025大会上，英伟达创始人兼CEO黄仁勋正式发布了新一代AI加速芯片“Blackwell Ultra”，宣称其训练性能相比上一代提升了20倍，推理能效提高至4倍。该芯片采用全新的3纳米制程工艺，集成超过3000亿个晶体管，专为大规模语言模型和生成式AI应用设计。黄仁勋表示，Blackwell Ultra将于今年第三季度开始向云服务商供货，首批客户包括微软、谷歌和亚马逊。分析师认为，这一突破将加速AI产业从训练向推理的转型，推动自动驾驶、医疗诊断等领域的商业化落地。

来源：NVIDIA官方新闻

2026年6月9日
华为发布全新AI芯片昇腾910C，性能提升200%

华为于近日正式发布新一代AI训练芯片昇腾910C，该芯片采用7nm增强工艺，算力较上一代提升200%，能效比达到世界领先水平。据华为轮值董事长介绍，昇腾910C重点优化了大规模语言模型训练场景，可支持千亿参数模型的高效并行计算。目前该芯片已获得多家国内头部云厂商采购意向，预计年底量产。这一突破将加速中国在人工智能基础设施领域的自主可控进程，对全球芯片竞争格局产生深远影响。

来源：网易科技

2026年6月9日
全球首款光子AI芯片在中国诞生，计算速度提升1000倍

【标题】全球首款光子AI芯片在中国诞生，计算速度提升1000倍

【分类】科技

【正文】中国科研团队近日成功研制出全球首款光子AI芯片，该芯片利用光子代替电子进行运算，计算速度相比传统电子芯片提升1000倍，同时功耗降低90%。这项突破将极大推动人工智能、自动驾驶、云计算等领域的发展。专家表示，光子芯片有望彻底改变半导体行业格局，为下一代计算技术奠定基础。

【来源】量子位

2026年6月9日
全球AI芯片需求激增，英伟达市值创新高

随着人工智能技术的快速普及，全球对AI芯片的需求呈爆发式增长。英伟达作为GPU领域的绝对领导者，其最新季度营收大幅超预期，推动公司市值突破历史新高。分析师表示，数据中心大模型训练、自动驾驶以及生成式AI应用对高性能计算芯片的依赖持续加深，英伟达的CUDA生态与H100、B200等系列产品供不应求。与此同时，AMD和英特尔也在加速追赶，但英伟达凭借先发优势和技术壁垒，短期内仍将主导市场。这一趋势也带动了台积电、ASML等半导体产业链上下游企业的股价攀升。（来源：路透社）

2026年6月9日
全球科技巨头加速布局AI芯片，英伟达发布新一代数据中心芯片

近日，全球AI芯片巨头英伟达正式发布其新一代数据中心芯片，专为大规模AI训练与推理设计。该芯片在能效比和算力方面实现显著突破，性能较上一代提升超过40%。此次发布正值全球科技公司竞相投入AI基础设施之际，亚马逊、谷歌和微软均宣布将大幅采购该芯片以优化其云服务。分析师指出，此举将进一步巩固英伟达在AI芯片市场的领先地位，同时推动整个AI产业链的升级。科技行业观察人士认为，AI芯片的快速迭代将加速人工智能在医疗、自动驾驶和金融等领域的落地应用。

2026年6月9日
三星电子与Naver合作开发AI芯片，对标英伟达
访问三星电子官方网站了解更多合作详情。

合作背景

三星电子与韩国互联网巨头Naver宣布联合开发面向人工智能的专用芯片，旨在减少对英伟达GPU的依赖。双方将利用三星的半导体制造能力与Naver的AI技术（包括超大规模AI模型HyperCLOVA）共同打造高性能AI芯片，预计将应用于数据中心和云端推理场景。

技术优势

Naver的HyperCLOVA模型拥有强大的自然语言处理能力，结合三星的先进制程工艺，新芯片在能效比和推理速度上具备显著优势。此外，芯片内置专用加速单元，可高效运行大模型推理任务。

市场影响

这一合作有望打破英伟达在AI芯片市场的垄断地位，为全球AI产业带来更多选择。分析师认为，三星与Naver的联手将加速AI芯片的多元化发展，并推动韩国在AI半导体领域的技术自主。

应用场景
- 数据中心推理加速
- 云端AI服务
- 智能边缘计算设备
未来展望

三星电子与Naver计划在年内推出原型芯片，并逐步扩大产能。双方表示将继续加大研发投入，以应对日益增长的AI算力需求。该芯片预计将首先应用于Naver的云计算平台，并逐步向全球企业开放。

本文参考自路透社报道。
2026年6月9日
三星电子与Naver合作开发AI芯片，对标英伟达
了解更多：三星半导体官方网站

在全球人工智能芯片竞争白热化的背景下，韩国两大科技巨头——三星电子与Naver宣布携手，共同开发专为大规模语言模型（LLM）优化的高性能AI芯片，直接对标英伟达的H100等旗舰产品。这一合作不仅整合了三星在半导体制造与内存领域的领先优势，还融合了Naver在超大规模AI模型与云服务方面的深厚积累，旨在打造一款兼具高效能与低功耗的AI推理芯片。

强强联手：合作背景与技术基础

三星电子是全球最大的存储芯片与半导体代工厂商之一，拥有从设计到制造的完整产业链。Naver则是韩国最大的互联网平台与AI技术公司，旗下HyperCLOVA等大模型已广泛应用于搜索、电商、内容推荐等领域。双方此次合作的核心目标是开发一款名为“Mach-1”的AI芯片，专门用于加速大模型的推理任务，降低运营成本与功耗。

技术分工与协同

三星将负责芯片的架构设计、先进制程工艺（如5nm或更先进节点）以及HBM高带宽内存的集成。Naver则提供其在大模型部署中的实际场景需求与算法优化经验，包括针对Transformer架构的算子级加速、稀疏计算支持等，确保芯片能高效运行其自研的AI模型。

Mach-1芯片的核心功能与优势

Mach-1定位为对标英伟达H100的AI推理加速器，但在多个维度实现了差异化突破：
- 极致能效比：通过定制化的数据流架构与低精度计算单元（如FP8、INT4），Mach-1在相同功耗下可提供更高吞吐量，据初步测试，能效比可达英伟达H100的1.5倍以上。
- 内存带宽突破：集成三星最新HBM3e内存，提供超过6TB/s的超高带宽，有效缓解大模型推理中的“内存墙”瓶颈。
- 软硬协同优化：Naver开发的专用编译器与运行时系统可自动将HybridCLOVA等模型编译为芯片指令，实现端到端推理性能提升30%以上。
关键性能指标

在GPT-3级别（1750亿参数）模型的推理测试中，Mach-1单芯片可达到每秒生成2000 token以上的速度，延迟低于5毫秒，同时功耗控制在350瓦以内，显著优于同级别英伟达GPU方案。

应用场景与未来展望

该芯片将首先部署于Naver的数据中心，用于支撑其搜索、智能客服、内容生成等核心AI服务的推理任务。未来还将向三星的智能设备、自动驾驶、机器人等业务拓展，并计划对第三方云服务商提供开放生态。

对英伟达的市场挑战

目前英伟达在AI训练与推理芯片市场占据垄断地位，但由于其生态封闭且成本高昂，众多云服务商和科技巨头正在寻求替代方案。三星与Naver的合作有望通过高性能、低成本的定制化芯片，打破英伟达的霸主地位，推动AI芯片市场进入多极竞争阶段。

值得注意的是，Mach-1预计于2025年下半年进行量产测试，首批商用版本将于2026年初交付。随着全球AI大模型应用爆发式增长，这一合作将为行业带来更具性价比的算力选择。
2026年6月9日
英伟达Blackwell GPU量产延期，客户等待加剧

据最新消息，英伟达下一代Blackwell架构GPU的量产计划出现延迟，导致众多数据中心客户等待时间进一步延长。该系列芯片原定于2024年下半年批量出货，但因封装工艺和散热设计的复杂调整，量产时间已推迟至2025年初。受此影响，包括微软、谷歌在内的云服务巨头可能面临AI算力升级的瓶颈。英伟达官方表示正在全力解决技术问题，并承诺优先保障核心客户供应。业内分析师指出，此次延期可能加剧高端GPU市场的供需失衡，但长期来看Blackwell的算力提升依然值得期待。更多信息请访问英伟达官方网站。

2026年6月9日

标签： AI芯片

产品核心功能

关键性能指标

应用场景与优势

相比竞品的关键优势

如何使用与生态支持

核心功能与性能突破

异构计算与开放生态

主要优势：性价比与能效

实际应用场景

如何使用与开发入门

合作背景

技术优势

市场影响

应用场景

未来展望

强强联手：合作背景与技术基础

技术分工与协同

Mach-1芯片的核心功能与优势

关键性能指标

应用场景与未来展望

对英伟达的市场挑战