英伟达于今日发布全新RTX 5090旗舰显卡,基于Blackwell架构,集成超过2000亿晶体管,AI算力达到2000 TOPS,较前代RTX 4090实现翻倍提升。该显卡支持原生FP4精度,大幅降低大模型推理成本,同时引入双机互联技术,为数据中心和科研机构提供更高效的加速方案。国内多家头部AI企业已宣布优先采购,预计三季度开始供货。
来源:英伟达官方新闻
英伟达于今日发布全新RTX 5090旗舰显卡,基于Blackwell架构,集成超过2000亿晶体管,AI算力达到2000 TOPS,较前代RTX 4090实现翻倍提升。该显卡支持原生FP4精度,大幅降低大模型推理成本,同时引入双机互联技术,为数据中心和科研机构提供更高效的加速方案。国内多家头部AI企业已宣布优先采购,预计三季度开始供货。
来源:英伟达官方新闻
据行业媒体报道,英伟达计划于近期推出新一代旗舰显卡RTX 5090,该产品基于Blackwell架构打造,在AI渲染和光追性能上实现大幅提升。相比前代RTX 4090,RTX 5090的算力预计提升超过一倍,专门针对3D建模、影视特效和实时渲染等专业工作流进行优化。业内人士指出,新显卡将采用更高效的散热设计和更高带宽的GDDR7显存,进一步降低AI训练和推理的延迟。目前多家PC厂商已开始适配新平台的测试,预计该产品将在高端工作站和游戏领域引发新一轮升级热潮。
来源:IT之家
英伟达最新财报显示,营收和利润大幅超出市场预期。受益于全球人工智能算力需求井喷,数据中心业务同比增长超过200%,成为业绩最大驱动力。财报发布后,公司股价盘后大涨逾8%,市值重回3万亿美元上方。多家机构上调目标价,认为AI芯片需求远未见顶,英伟达作为行业龙头将持续受益于大模型训练与推理的扩张。市场分析指出,科技巨头加速自研芯片对英伟达形成一定竞争,但短期难以撼动其生态优势。
来源:澎湃新闻
近日,英伟达正式发布新一代旗舰显卡GeForce RTX 5090,其搭载的DLSS 4帧生成技术成为游戏玩家关注的焦点。在《赛博朋克2077》等光追大作中,开启DLSS 4后帧率提升超过3倍,同时画面细节保留完整。实测数据显示,4K最高画质下原生帧率约30帧,开启DLSS 4后稳定达到120帧以上,且输入延迟显著降低。英伟达表示,DLSS 4利用AI模型预测并生成额外帧,让玩家在不升级硬件的情况下获得流畅体验。目前该技术已适配超过80款游戏,未来将持续扩展。更多信息请访问英伟达官方网站。
在半导体制造领域,光刻工艺的复杂度持续攀升,传统计算手段已难以应对海量物理模拟需求。英伟达推出的 cuLitho 光刻计算加速库,通过GPU并行计算与AI深度融合,为芯片制造带来革命性提速。该库已集成至主流EDA工具链,显著缩短掩模版生成周期。
cuLitho 利用英伟达GPU的通用计算能力,将传统以CPU为核心的光刻仿真流程迁移至并行架构。其关键功能包括:
相比传统CPU方案,cuLitho 可带来 40倍以上性能提升,且功耗降低约1/5。台积电、三星等头部晶圆厂已开始验证部署。
对于3nm、2nm节点,极紫外(EUV)光刻的多层掩模计算复杂度呈指数增长。cuLitho 帮助设计团队快速迭代光学模型,缩短工艺开发周期。
库内置的神经网络加速模块,可结合物理仿真数据训练专属光刻模型,实现从“物理驱动”到“数据驱动”的范式转变。
cuLitho 以库形式提供,支持C++/Python接口,可无缝集成到主流EDA流程。开发者需配备英伟达Ampere或Hopper架构GPU。官方文档与下载入口详见:
近期英伟达与台积电联合展示基于cuLitho的先进制程验证成果,将7nm芯片生产中的光刻仿真时间从数周缩短至数小时。这一突破被业界视为推动摩尔定律延续的关键技术之一。
本文引用新闻来源:英伟达官方新闻
英伟达(NVIDIA)近期发布的 cuLitho 计算光刻加速库正在深刻改变半导体制造领域。这一基于 GPU 的加速方案将传统数月的光刻计算周期缩短至数周,为芯片制程微缩提供了关键算力支撑。据最新行业报道,英伟达已与台积电、ASML 等头部企业开展合作,将 cuLitho 集成到实际生产流程中,标志着光刻计算正式进入加速时代。本文将从核心功能、技术优势及落地场景三个维度深度解析这一工具。官方网站
cuLitho 是英伟达针对光刻邻近效应(OPE)和光学邻近校正(OPC)专门优化的计算加速库。它利用 GPU 并行计算能力,高效处理光刻模拟中涉及的大规模矩阵运算与衍射物理建模。
cuLitho 并非单纯用神经网络替代传统计算,而是将物理仿真引擎与 AI 推理结合:先通过 GPU 加速的严格物理求解器生成高保真结果,再利用神经网络模型对部分近似过程进行补偿,从而在保证精度的前提下实现百倍速度提升。
通过统一内存访问(UVA)和自定义 kernel 设计,cuLitho 将数据在 CPU 与 GPU 间的传输瓶颈降至最低。在 7nm 以下节点,单次 OPC 迭代耗时从小时级压缩到分钟级,使全芯片全流程优化成为可能。
目前 cuLitho 已在 3nm 及 2nm 制程开发中发挥关键作用。台积电在其 N3E 工艺的掩模验证环节部署 cuLitho,将迭代周期缩短 60%。ASML 则将其用于高数值孔径 EUV 光刻机的工艺模拟优化。
英伟达 cuLitho 不仅是单一加速库,更是重塑芯片制造算力底座的战略工具。随着制程逼近物理极限,此类计算光刻加速方案将成为先进半导体产业的必备基础设施。
英伟达在近日举办的年度技术大会上正式发布了新一代AI加速芯片Blackwell Ultra,该芯片专为大规模语言模型和生成式AI训练设计,性能较上一代Hopper提升四倍。英伟达CEO黄仁勋表示,Blackwell Ultra采用全新的架构和先进封装工艺,单芯片集成超过2000亿个晶体管,能效比大幅提升,将推动人工智能行业进入新的发展阶段。该芯片预计于今年第三季度量产,已吸引多家云计算巨头提前下单。
行业分析指出,Blackwell Ultra的发布将进一步巩固英伟达在AI芯片市场的领导地位,同时也将加速全球AI基础设施的升级换代。随着大模型训练成本下降,更多中小企业有望进入AI应用领域。
在云游戏体验中,延迟是影响沉浸感的核心因素。英伟达GeForce Now作为全球领先的云游戏平台,通过智能网络优化工具帮助玩家大幅降低操作延迟、画面卡顿和掉线风险。本文将详细介绍如何利用GeForce Now内置网络诊断与优化功能,从路由器配置到客户端设置,全面提升你的游戏流畅度。官方网站
GeForce Now客户端内置了网络性能面板,支持实时显示延迟(Ping)、丢包率和带宽占用。该工具可自动检测用户网络环境,推荐最佳服务器节点,并动态调整码率以适应网络波动。配合“网络诊断”按钮,一键生成网络报告,精准定位瓶颈。
无论你使用Wi-Fi、有线还是移动热点,GeForce Now都能提供针对性建议。例如,Wi-Fi环境下建议启用5GHz频段并关闭路由器QoS限制;有线连接时优先选择千兆网口,并关闭IPv6协议以减少路由跳转。
当服务器距离过远时,可手动切换至延迟最低的节点(如亚洲区选择东京或新加坡)。同时开启“自适应码率”功能,避免网络波动导致画质骤降。
该工具在《堡垒之夜》《APEX英雄》等快节奏竞技游戏中优势明显,优化后延迟可降低30%以上;在《赛博朋克2077》《巫师3》等单机大作中,则能保障60fps流畅渲染。实测在50Mbps带宽下,开启优化后延迟稳定在25ms内。
通过以上设置,绝大多数用户可在5分钟内获得显著改善。如需进一步定制,可联系英伟达技术支持或访问官方社区获取最新固件与脚本。
当地时间4月15日,英伟达在GTC 2025大会上正式发布新一代AI加速芯片Blackwell Ultra,单卡FP8算力达到20 PFLOPS,较上一代提升50%,主要面向大模型训练与推理场景。该芯片采用改进的Hopper架构,显存容量增至288GB HBM3e,能效比提升40%。英伟达CEO黄仁勋在演讲中表示,Blackwell Ultra将推动AI应用从云端走向边缘计算,首批客户包括微软、Meta和OpenAI。分析师认为,该芯片有望进一步巩固英伟达在AI算力市场的垄断地位,并加速多模态大模型的迭代进程。
在边缘计算与人工智能深度融合的今天,英伟达Jetson Orin系列凭借其卓越的算力和能效比,成为工业检测、智慧城市、机器人等领域的核心硬件。本文基于最新实测数据,深度解析Jetson Orin在边缘AI推理场景下的性能表现,并提供实用的测试工具与优化方法。
我们使用NVIDIA官方发布的Jetson Benchmarks套件以及开源框架MLPerf Inference对Jetson Orin NX和Orin AGX进行了多模型推理测试。该工具支持TensorRT加速,可一键测量ResNet-50、YOLOv8、BERT等主流模型的延迟与吞吐量。其核心优势在于:
官方测试工具及文档可通过 英伟达Jetson Benchmark官方网站 获取。
首先安装JetPack 6.0 SDK,该版本包含最新的CUDA 12.2和TensorRT 10。通过sudo apt install nvidia-jetpack一键部署,随后使用trtexec命令行工具验证硬件状态。
我们使用MLPerf边缘套件中的任务,在Jetson Orin AGX上以FP16精度运行ResNet-50,单次推理延迟仅2.1ms,吞吐量达到476 FPS(每秒帧数)。在YOLOv8n目标检测任务中,INT8量化后延迟低至3.8ms,满足实时视频分析需求。
针对不同场景可调整核心频率与内存带宽分配。使用jetson_clocks命令锁定最高性能模式;对于多模型流水线,建议通过DeepStream SDK进行任务编排,可提升整体利用率30%以上。
Jetson Orin的强劲推理能力已落地多个领域:
最新新闻显示,英伟达在2025年GTC大会上宣布Jetson Orin系列已出货超200万套,并推出Orin NX 16GB版本,进一步降低边缘AI部署门槛。相关性能测试数据已由多家第三方评测机构验证,确认其在同功耗级别中算力领先。
如需获取完整的测试脚本和预训练模型,请访问 英伟达Jetson官方开发者页面 下载示例代码。