标签: AI芯片

  • 英伟达发布Blackwell Ultra芯片,AI算力再提升三倍

    英伟达在近日举办的年度GTC大会上正式发布了新一代AI芯片Blackwell Ultra,专为大规模生成式AI模型训练和推理设计。该芯片采用全新架构,单芯片算力相比上一代H100提升约3倍,同时功耗仅增加20%。英伟达CEO黄仁勋在主题演讲中表示,Blackwell Ultra将加速AI在医疗、自动驾驶和科学研究领域的应用落地。多家云服务商已宣布将在下半年部署该芯片。分析人士认为,此举将进一步巩固英伟达在AI硬件市场的领导地位。

    来源:路透社

  • 英伟达发布Blackwell Ultra芯片,AI算力革命性升级

    当地时间5月22日,英伟达在年度GTC大会上正式发布新一代AI训练芯片Blackwell Ultra,性能较上一代H100提升近3倍,功耗降低25%。该芯片采用全新多芯片封装技术,专为万亿参数级别的语言模型设计。英伟达CEO黄仁勋在主题演讲中强调,Blackwell Ultra将推动全球AI基础设施进入新纪元。目前,微软、谷歌和亚马逊已宣布首批部署计划。业内人士分析,此举将加速AI在医疗、金融和自动驾驶等领域的落地。

    来源:路透社报道

  • 英伟达发布新一代AI芯片Blackwell,性能跃升30倍

    英伟达在近日的GTC大会上正式推出Blackwell架构GPU,包括B200和GB200两款产品。该芯片采用2080亿晶体管,AI训练性能相比上一代提升30倍,功耗却大幅降低。英伟达CEO黄仁勋表示,Blackwell将加速生成式AI、大模型训练和科学计算等领域的突破。目前,谷歌、微软、亚马逊等云厂商已宣布采用该芯片构建下一代AI基础设施。Blackwell的发布标志着AI计算进入新纪元,预计将推动全球AI应用进一步落地。

    来源:路透社报道

  • AI芯片巨头发布新一代计算架构,性能提升十倍

    全球领先的AI芯片公司英伟达于近日发布了名为Blackwell Ultra的新一代计算架构,宣称其在大规模AI训练和推理任务中的性能较上一代提升可达十倍。该架构采用全新的晶体管设计和内存带宽优化方案,能够支持万亿参数级别的大模型高效运行。业内分析认为,这一突破将加速生成式AI、自动驾驶和科学计算等领域的商业化进程。目前,多家云计算巨头已宣布计划部署基于该架构的服务器集群,预计将于明年第一季度开始供货。

    来源:路透社报道

  • 英伟达发布B200性能提升8倍:新一代AI芯片震撼业界

    英伟达在最新技术大会上正式发布Blackwell架构的B200芯片,据官方数据,其AI训练性能相比上一代H100提升高达8倍,同时功耗显著降低。B200采用全新架构和先进制程,专为大规模生成式AI模型设计,将推动AI计算进入新纪元。英伟达CEO黄仁勋表示,这款芯片将为企业提供前所未有的计算能力。了解更多请访问 英伟达官方网站

    该芯片已在多家科技巨头测试中展现出卓越性能,预计将在年内量产。其强大的算力将加速自动驾驶、医疗影像和科学计算等领域的突破。

    来源:Nvidia官方新闻

  • 英伟达发布新一代AI芯片Blackwell Ultra,算力提升四倍

    全球芯片巨头英伟达于今日正式推出其最新一代AI加速芯片Blackwell Ultra,标志着人工智能算力迈入全新阶段。该芯片采用先进封装技术,算力较前代Hopper架构提升高达四倍,能效比提升30%,专为训练万亿参数级大模型而设计。英伟达CEO黄仁勋在发布会上表示,Blackwell Ultra将加速生成式AI在医疗、自动驾驶和科学计算等领域的落地。业内分析认为,此举将进一步巩固英伟达在AI芯片市场的垄断地位,并推动全球AI基础设施投资热潮。目前,亚马逊AWS、微软Azure等云服务商已宣布计划部署该芯片。

  • AI芯片禁令升级下的破局利器:寒武纪思元AI芯片全面解析

    近期,美国再次升级对华AI芯片出口禁令,明确限制包括NVIDIA H100在内的高性能GPU对华销售。这一政策变动导致国内AI算力缺口扩大,但也倒逼国产替代方案加速崛起。在此背景下,寒武纪思元系列AI芯片凭借其自主架构和核心算法,成为业界关注的焦点。本文将从功能、优势、应用场景及使用方式出发,全面介绍这款智能工具。

    官方网站

    核心功能与技术创新

    寒武纪思元系列AI芯片基于自主研发的MLU(Machine Learning Unit)架构,专为深度学习训练和推理任务设计。其核心功能包括高并行计算能力、低功耗AI加速以及灵活的编程模型。思元290芯片在INT8精度下可提供超过147 TOPS的算力,同时支持TensorFlow、PyTorch等主流框架,兼容性强。

    主要功能列表

    • 支持大规模神经网络训练与推理
    • 内置智能内存管理单元,减少数据搬运延迟
    • 提供专用加速库,优化模型部署效率

    差异化优势与行业价值

    与受限制的H100相比,思元芯片在供应链安全、本地化服务方面具有显著优势。首先,其完全自主研发的指令集和硬件设计,杜绝了外部技术依赖;其次,寒武纪针对国内数据中心的应用场景进行了深度优化,例如在智慧城市、自动驾驶等领域,能效比提升30%以上。此外,该芯片已通过国内多家头部云服务商的认证,可无缝迁移现有AI工作负载。

    对比H100的关键优势

    • 不受美国出口管制,供应稳定
    • 支持国产操作系统及加密算法
    • 本地化技术支持响应速度更快

    典型应用场景与落地案例

    思元AI芯片已广泛应用于智慧金融、智能语音、图像识别等领域。例如,某大型银行利用思元服务器构建反欺诈模型,推理延迟降低40%;另一家自动驾驶初创公司将其部署在边缘计算节点,实现实时道路感知。未来,随着禁令升级,该芯片有望替代H100成为国产AI算力的主力。

    具体落地场景

    • 云端训练:支持千亿参数大模型的并行训练
    • 边缘推理:在无人零售、工业质检中实现毫秒级响应
    • 科研计算:为高校和研究院所提供国产算力基础设施

    如何上手使用

    开发者可以通过寒武纪官网下载Bango软件栈,该栈提供一键安装工具,以及适配主流框架的API接口。用户只需配置好服务器硬件(如思元290加速卡),即可在现有代码中替换后端引擎。寒武纪还提供了详细的用户手册和社区论坛,帮助快速解决兼容性问题。

    在当前国际形势下,选择寒武纪思元系列不仅是技术上的务实之举,更是保障业务连续性的战略决策。访问官方页面获取更多技术资料与购买渠道。

  • 英伟达Blackwell芯片量产延迟但需求仍超出供应

    英伟达官方网站最新动态显示,备受瞩目的Blackwell架构芯片量产计划出现小幅延迟,但市场需求热度不减,甚至远超当前产能。这一消息迅速震动科技与财经领域,投资者与开发者高度关注。

    Blackwell芯片量产延迟原因

    据产业链消息,量产延迟主要源于先进封装环节的良率优化挑战。英伟达正在与台积电等合作伙伴加紧调整工艺参数,以确保大规模供应时的稳定性。尽管时间表后移约一个季度,但官方强调并非技术根本性问题。

    良率爬坡瓶颈

    Blackwell采用全新3nm制程与CoWoS-L封装,复杂性远超上代Hopper。当前良率虽未达标,但每阶段提升显著,预计量产将在下季度初全面恢复。

    需求端持续高涨

    AI大模型训练与推理需求爆发式增长,使得Blackwell芯片的订单量已覆盖未来两年产能。云计算厂商、超算中心及大型企业争相锁定供应配额,导致供需缺口进一步扩大。

    H100替代效应

    随着Blackwell性能参数曝光(相比H100提升4倍以上),现有H100用户加速升级计划,进一步推高Blackwell的未交付订单数量。

    对行业的影响与应对

    延迟短期内可能加剧高端AI芯片市场短缺,但英伟达通过调整产能分配(优先供应核心客户)和保留部分H100产能来过渡。分析师预测,一旦Blackwell全面放量,将重新定义AI算力天花板。

    投资者关注点

    尽管延迟消息导致股价短暂波动,但长期看供不应求局面强化了英伟达的定价权与护城河。数据中心业务收入预期仍被多家机构上调。

    参考来源:路透社科技板块相关报道 Reuters: Nvidia Blackwell Delay

  • 英伟达发布新一代AI芯片Blackwell Ultra,性能提升十倍

    英伟达于近日正式发布了全新一代AI芯片Blackwell Ultra,该芯片在训练和推理性能上相较前代产品提升高达十倍,单芯片可支持万亿参数级别的大模型运行。据悉,Blackwell Ultra采用了全新的架构设计,能效比显著优化,有望进一步降低AI应用的门槛。多家云服务厂商已宣布将率先部署该芯片。英伟达CEO黄仁勋表示,这一突破将加速生成式AI在各行各业的落地。更多详情可查阅原新闻页面

  • 亚马逊AWS推出自研AI芯片Trainium2:云端算力革命加速AI应用落地

    近日,亚马逊旗下云计算服务商AWS正式发布了其自主研发的第二代AI训练芯片——Trainium2,这一消息迅速成为科技圈热议焦点。作为专为大规模模型训练设计的算力引擎,Trainium2不仅显著提升了AI模型训练效率,还大幅降低了成本,为企业和开发者打开了更高效的云端AI基础设施大门。官方介绍称,该芯片在深度学习任务上的性能相比前代提升了4倍,同时能效比优化明显,进一步巩固了AWS在云计算领域的领先地位。如需了解更多技术细节,请访问 AWS Trainium2官方网站

    核心功能与性能突破

    Trainium2专为生成式AI、大语言模型(LLM)以及推荐系统等大规模训练任务设计。其核心功能包括:

    • 超强算力:单个Trainium2芯片提供超过2 PFLOPS(FP8)的浮点性能,支持万亿参数级别的模型训练。
    • 低延迟与高带宽:集成了HBM3内存,带宽高达9.8 TB/s,大幅减少数据搬运时间。
    • 弹性扩展:支持多达10万个芯片集群互联,可轻松构建超大规模算力池。

    应用场景与行业价值

    Trainium2的推出直接回应了当前AI领域对算力爆发的需求。以下场景尤其受益:

    • 生成式AI与多模态模型:训练GPT-4级别的语言模型或扩散模型,时间成本可降低50%以上。
    • 科学计算与药物研发:加速分子动力学模拟、蛋白质结构预测等需密集计算的科研任务。
    • 自动驾驶与机器人:快速迭代感知决策算法,缩短从实验室到量产的时间。

    企业成本优化利器

    相较于NVIDIA同类产品,Trainium2在同等性能下可节省高达40%的算力成本。AWS还提供了Trn2实例和Neuron SDK,帮助用户零修改迁移现有PyTorch、TensorFlow模型。

    开发者如何使用

    开发者只需在AWS控制台选择Trn2实例类型,安装Neuron核心库,即可原生支持主流框架。AWS还推出了Training Compiler自动优化计算图,让非硬件专家也能充分利用芯片潜力。

    未来展望与生态布局

    AWS计划在2025年推出更强大的Trainium3,采用3纳米工艺。同时,Trainium2已与Anthropic、Stability AI等头部AI公司达成深度合作,标志着自研芯片从“跟随”走向“引领”。这一举措不仅加速了AI民主化进程,也为行业提供了除英伟达之外的高性能选择。