Qualcomm Hexagon NPU：赋能移动端生成式AI的性能引擎

作者：

在

随着生成式AI逐步走向移动设备，高通推出的Qualcomm Hexagon NPU成为核心计算单元。Hexagon NPU集成于骁龙移动平台，专为加速生成式AI推理任务设计，支持大语言模型、图像生成等场景在终端侧高效运行。官方访问链接请点击：官方网站。

核心功能与技术优势

Hexagon NPU采用多核异构架构，包含标量、向量和张量加速器，针对Transformer模型进行深度优化。其关键能力包括：

在生成式AI任务中，Hexagon NPU负责核心推理，Adreno GPU处理图像渲染，Kryo CPU则调度预处理和后处理任务。这种“三核协同”机制让设备在对话、文生图、实时翻译等场景下响应更快。

Hexagon NPU已广泛应用于主流智能终端：

高通提供Qualcomm AI Hub和Hexagon SDK，开发者可轻松将PyTorch、TensorFlow模型转换为NPU可执行格式，并利用AI Model Efficiency Toolkit进行量化剪枝。目前已有超过100个生成式AI模型在Hexagon NPU上通过验证。

终端用户无需手动操作，设备厂商通过系统更新内置AI引擎即可调用NPU。开发者则需：

随着骁龙8 Gen4等后续平台落地，Hexagon NPU将在移动端生成式AI领域扮演更关键角色，推动更丰富、更安全的智能化体验。