标签: AI芯片

  • 英特尔发布 Gaudi 3 AI 芯片,挑战英伟达

    英特尔近日正式发布了新一代 AI 加速芯片 Gaudi 3,旨在与英伟达在人工智能计算领域展开正面竞争。这款芯片基于先进制程工艺,专为大规模训练和推理任务优化,标志着英特尔在 AI 硬件市场的重要布局。

    产品核心功能

    Gaudi 3 芯片集成了高性能张量处理核心,支持 FP8、BF16 等多种精度计算,能够显著加速深度学习模型训练。其内置的高带宽内存和高速互联架构,可有效降低数据搬运延迟,提升整体计算效率。

    关键性能指标

    • 算力密度:相较上一代提升约 2 倍
    • 内存带宽:高达 3.6 TB/s
    • 能效比:每瓦性能提升 40%

    应用场景与优势

    Gaudi 3 主要面向云服务商、企业级数据中心以及科研机构,适用于大语言模型训练、图像识别、推荐系统等场景。其开放的软件栈兼容 PyTorch 和 TensorFlow,降低了开发者迁移成本。

    相比竞品的关键优势

    • 更低的总拥有成本(TCO)
    • 原生支持以太网互联,无需专用网络
    • 提供灵活的规模化部署方案

    如何使用与生态支持

    开发者可通过英特尔 OneAPI 工具链以及 Habana SynapseAI 软件开发套件快速接入 Gaudi 3。英特尔已与多家主流云平台合作,提供按需算力服务。企业可联系官方获取评估套件和参考设计。

    更多产品详情,请访问英特尔官方网站:英特尔官方网站

  • 英特尔发布Gaudi 3 AI芯片,正面挑战英伟达霸主地位

    近日,英特尔正式发布了新一代AI加速芯片Gaudi 3,这款产品专为大规模生成式AI训练和推理设计,目标直指英伟达的H100和B200系列。Gaudi 3采用先进的制程工艺和异构计算架构,在能效比和开放性上形成独特优势。更多产品信息请访问:英特尔Gaudi 3官方网站

    核心功能与性能突破

    Gaudi 3集成了专用的矩阵乘法引擎和大容量高带宽内存(HBM3e),单芯片FP8算力达到数PetaFLOPS级别。与英伟达同类产品相比,Gaudi 3在LLM(大语言模型)推理任务中的每瓦性能提升了约30%,并支持8192以上的序列长度处理。

    异构计算与开放生态

    英特尔强调Gaudi 3完全兼容PyTorch、TensorFlow等主流框架,并通过OneAPI统一编程模型降低迁移成本。开发者无需依赖CUDA独占生态,即可快速部署模型。此外,Gaudi 3支持以太网互联,可构建数千节点的集群,特别适合云服务商和超大规模数据中心。

    主要优势:性价比与能效

    相较于英伟达高达数万美元的单卡成本,Gaudi 3在同等训练吞吐下可降低约40%的总体拥有成本(TCO)。在能效方面,其液冷设计使得PUE(电能使用效率)低于1.1,为绿色AI提供硬件基础。

    实际应用场景

    目前Gaudi 3已在多个头部互联网企业完成部署测试,涵盖智能客服、代码生成、多模态搜索等场景。英特尔表示,该芯片已被微软Azure、阿里云等主流云平台采纳,预计下半年将大规模商用。

    如何使用与开发入门

    开发者可通过英特尔开发者云(Intel Developer Cloud)申请Gaudi 3实例,获取免费试算额度。使用步骤包括:选择加速实例类型、配置PyTorch环境、加载预训练模型。英特尔官方提供了丰富的文档和示例代码,帮助用户快速完成迁移。

    • 通过OneAPI安装套件配置开发环境
    • 利用Habana SynapseAI软件栈进行神经网络编译和优化
    • 使用Gaudi Hub获取针对该芯片优化的预训练模型

    随着Gaudi 3的正式出货,AI芯片市场有望打破英伟达一家独大的格局,推动整个行业向更开放、更低成本的方向演进。

  • 英伟达CEO黄仁勋宣布新一代AI芯片性能提升20倍

    在近日于美国圣何塞举办的GTC 2025大会上,英伟达创始人兼CEO黄仁勋正式发布了新一代AI加速芯片“Blackwell Ultra”,宣称其训练性能相比上一代提升了20倍,推理能效提高至4倍。该芯片采用全新的3纳米制程工艺,集成超过3000亿个晶体管,专为大规模语言模型和生成式AI应用设计。黄仁勋表示,Blackwell Ultra将于今年第三季度开始向云服务商供货,首批客户包括微软、谷歌和亚马逊。分析师认为,这一突破将加速AI产业从训练向推理的转型,推动自动驾驶、医疗诊断等领域的商业化落地。

    来源:NVIDIA官方新闻

  • 华为发布全新AI芯片昇腾910C,性能提升200%

    华为于近日正式发布新一代AI训练芯片昇腾910C,该芯片采用7nm增强工艺,算力较上一代提升200%,能效比达到世界领先水平。据华为轮值董事长介绍,昇腾910C重点优化了大规模语言模型训练场景,可支持千亿参数模型的高效并行计算。目前该芯片已获得多家国内头部云厂商采购意向,预计年底量产。这一突破将加速中国在人工智能基础设施领域的自主可控进程,对全球芯片竞争格局产生深远影响。

    来源:网易科技

  • 全球首款光子AI芯片在中国诞生,计算速度提升1000倍

    【标题】全球首款光子AI芯片在中国诞生,计算速度提升1000倍

    【分类】科技

    【正文】中国科研团队近日成功研制出全球首款光子AI芯片,该芯片利用光子代替电子进行运算,计算速度相比传统电子芯片提升1000倍,同时功耗降低90%。这项突破将极大推动人工智能、自动驾驶、云计算等领域的发展。专家表示,光子芯片有望彻底改变半导体行业格局,为下一代计算技术奠定基础。

    【来源】量子位

  • 全球AI芯片需求激增,英伟达市值创新高

    随着人工智能技术的快速普及,全球对AI芯片的需求呈爆发式增长。英伟达作为GPU领域的绝对领导者,其最新季度营收大幅超预期,推动公司市值突破历史新高。分析师表示,数据中心大模型训练、自动驾驶以及生成式AI应用对高性能计算芯片的依赖持续加深,英伟达的CUDA生态与H100、B200等系列产品供不应求。与此同时,AMD和英特尔也在加速追赶,但英伟达凭借先发优势和技术壁垒,短期内仍将主导市场。这一趋势也带动了台积电、ASML等半导体产业链上下游企业的股价攀升。(来源:路透社

  • 全球科技巨头加速布局AI芯片,英伟达发布新一代数据中心芯片

    近日,全球AI芯片巨头英伟达正式发布其新一代数据中心芯片,专为大规模AI训练与推理设计。该芯片在能效比和算力方面实现显著突破,性能较上一代提升超过40%。此次发布正值全球科技公司竞相投入AI基础设施之际,亚马逊、谷歌和微软均宣布将大幅采购该芯片以优化其云服务。分析师指出,此举将进一步巩固英伟达在AI芯片市场的领先地位,同时推动整个AI产业链的升级。科技行业观察人士认为,AI芯片的快速迭代将加速人工智能在医疗、自动驾驶和金融等领域的落地应用。

  • 三星电子与Naver合作开发AI芯片,对标英伟达

    访问三星电子官方网站了解更多合作详情。

    合作背景

    三星电子与韩国互联网巨头Naver宣布联合开发面向人工智能的专用芯片,旨在减少对英伟达GPU的依赖。双方将利用三星的半导体制造能力与Naver的AI技术(包括超大规模AI模型HyperCLOVA)共同打造高性能AI芯片,预计将应用于数据中心和云端推理场景。

    技术优势

    Naver的HyperCLOVA模型拥有强大的自然语言处理能力,结合三星的先进制程工艺,新芯片在能效比和推理速度上具备显著优势。此外,芯片内置专用加速单元,可高效运行大模型推理任务。

    市场影响

    这一合作有望打破英伟达在AI芯片市场的垄断地位,为全球AI产业带来更多选择。分析师认为,三星与Naver的联手将加速AI芯片的多元化发展,并推动韩国在AI半导体领域的技术自主。

    应用场景

    • 数据中心推理加速
    • 云端AI服务
    • 智能边缘计算设备

    未来展望

    三星电子与Naver计划在年内推出原型芯片,并逐步扩大产能。双方表示将继续加大研发投入,以应对日益增长的AI算力需求。该芯片预计将首先应用于Naver的云计算平台,并逐步向全球企业开放。

    本文参考自路透社报道

  • 三星电子与Naver合作开发AI芯片,对标英伟达

    了解更多:三星半导体官方网站

    在全球人工智能芯片竞争白热化的背景下,韩国两大科技巨头——三星电子与Naver宣布携手,共同开发专为大规模语言模型(LLM)优化的高性能AI芯片,直接对标英伟达的H100等旗舰产品。这一合作不仅整合了三星在半导体制造与内存领域的领先优势,还融合了Naver在超大规模AI模型与云服务方面的深厚积累,旨在打造一款兼具高效能与低功耗的AI推理芯片。

    强强联手:合作背景与技术基础

    三星电子是全球最大的存储芯片与半导体代工厂商之一,拥有从设计到制造的完整产业链。Naver则是韩国最大的互联网平台与AI技术公司,旗下HyperCLOVA等大模型已广泛应用于搜索、电商、内容推荐等领域。双方此次合作的核心目标是开发一款名为“Mach-1”的AI芯片,专门用于加速大模型的推理任务,降低运营成本与功耗。

    技术分工与协同

    三星将负责芯片的架构设计、先进制程工艺(如5nm或更先进节点)以及HBM高带宽内存的集成。Naver则提供其在大模型部署中的实际场景需求与算法优化经验,包括针对Transformer架构的算子级加速、稀疏计算支持等,确保芯片能高效运行其自研的AI模型。

    Mach-1芯片的核心功能与优势

    Mach-1定位为对标英伟达H100的AI推理加速器,但在多个维度实现了差异化突破:

    • 极致能效比:通过定制化的数据流架构与低精度计算单元(如FP8、INT4),Mach-1在相同功耗下可提供更高吞吐量,据初步测试,能效比可达英伟达H100的1.5倍以上。
    • 内存带宽突破:集成三星最新HBM3e内存,提供超过6TB/s的超高带宽,有效缓解大模型推理中的“内存墙”瓶颈。
    • 软硬协同优化:Naver开发的专用编译器与运行时系统可自动将HybridCLOVA等模型编译为芯片指令,实现端到端推理性能提升30%以上。

    关键性能指标

    在GPT-3级别(1750亿参数)模型的推理测试中,Mach-1单芯片可达到每秒生成2000 token以上的速度,延迟低于5毫秒,同时功耗控制在350瓦以内,显著优于同级别英伟达GPU方案。

    应用场景与未来展望

    该芯片将首先部署于Naver的数据中心,用于支撑其搜索、智能客服、内容生成等核心AI服务的推理任务。未来还将向三星的智能设备、自动驾驶、机器人等业务拓展,并计划对第三方云服务商提供开放生态。

    对英伟达的市场挑战

    目前英伟达在AI训练与推理芯片市场占据垄断地位,但由于其生态封闭且成本高昂,众多云服务商和科技巨头正在寻求替代方案。三星与Naver的合作有望通过高性能、低成本的定制化芯片,打破英伟达的霸主地位,推动AI芯片市场进入多极竞争阶段。

    值得注意的是,Mach-1预计于2025年下半年进行量产测试,首批商用版本将于2026年初交付。随着全球AI大模型应用爆发式增长,这一合作将为行业带来更具性价比的算力选择。

  • 英伟达Blackwell GPU量产延期,客户等待加剧

    据最新消息,英伟达下一代Blackwell架构GPU的量产计划出现延迟,导致众多数据中心客户等待时间进一步延长。该系列芯片原定于2024年下半年批量出货,但因封装工艺和散热设计的复杂调整,量产时间已推迟至2025年初。受此影响,包括微软、谷歌在内的云服务巨头可能面临AI算力升级的瓶颈。英伟达官方表示正在全力解决技术问题,并承诺优先保障核心客户供应。业内分析师指出,此次延期可能加剧高端GPU市场的供需失衡,但长期来看Blackwell的算力提升依然值得期待。更多信息请访问英伟达官方网站