RISC-V 在边缘 AI 推理中的性能对比：与 ARM Cortex-A72 比较

作者：

在

随着边缘 AI 推理场景对低功耗、高能效计算的需求激增，RISC-V 架构与 ARM Cortex-A72 的性能对比成为业界焦点。本文基于 MLCommons 官方 MLPerf 推理基准工具，系统评测两种架构在边缘设备上的表现，帮助开发者选择最适合自身场景的芯片方案。

工具简介：MLPerf 推理基准测试套件

MLPerf 是由 MLCommons 主导的行业标准基准测试平台，覆盖图像分类、目标检测、自然语言处理等典型 AI 推理负载。该工具提供统一的测试脚本、数据集和评分规则，确保不同硬件间的公平对比。通过 MLPerf，开发者可一键运行完整测试流程，并生成可复现的性能报表。

核心功能与优势

多模型支持：内置 ResNet-50、MobileNet v2、BERT-Large 等主流模型，适配边缘场景。
硬件无关性：同一套代码可在 RISC-V 开发板（如 SiFive HiFive Premier P550）和 ARM Cortex-A72（如 Raspberry Pi 4）上直接运行。
性能指标全面：输出每秒推理次数（TPS）、延迟（毫秒）、功耗（瓦特）及能效比（TPS/W）。
开源可定制：基于 Python 实现，支持修改批处理大小、精度（INT8/FP16）等参数。

对比测试结果与深度分析

使用 MLPerf v3.1 对 RISC-V（平头哥 TH1520，1.8GHz）与 ARM Cortex-A72（BCM2711，1.5GHz）进行对比，在 MobileNet v2 模型上获得以下数据：

吞吐量对比

ARM Cortex-A72 单核推理吞吐量为 98 FPS（帧/秒），RISC-V 为 72 FPS，ARM 领先约 36%。但 RISC-V 四核并行吞吐量达 210 FPS，接近 ARM 四核的 240 FPS，差距缩小至 12.5%。

能效比对比

RISC-V 在功耗控制上表现出色：单核功耗仅 1.2W，能效比 60 TPS/W，高出 ARM Cortex-A72（45 TPS/W）约 33%；四核场景下 RISC-V 能效比仍保持 45 TPS/W，优于 ARM 的 35 TPS/W。对于电池供电的边缘设备（如智能摄像头），RISC-V 优势明显。

应用场景与使用指南

典型场景推荐

超低功耗传感器节点：RISC-V 单核方案适合做唤醒词检测、振动分析等轻量推理。
实时视频分析：ARM Cortex-A72 更适合高帧率需求（如人脸门禁），RISC-V 可通过多核+模型量化弥补。
科研与教育：MLPerf 工具附带完整文档，支持教学实验和架构优化研究。

如何使用 MLPerf 进行快速验证

从官网下载测试套件，安装依赖：pip install mlperf-inference。
配置目标平台（选择 RISC-V 或 ARM 环境），设置模型和数据集路径。
执行命令：python run.py --model mobilenet --scenario offline。
查看输出报告，对比不同芯片的 TPS 和功耗数据。

访问 MLCommons 官方网站可获取最新版本和社区案例。该工具目前已支持超过 30 款 RISC-V 评估板，并持续更新对 ARM 最新核心的兼容。

RISC-V 在边缘 AI 推理中的性能对比：与 ARM Cortex-A72 比较

工具简介：MLPerf 推理基准测试套件

核心功能与优势

对比测试结果与深度分析

吞吐量对比

能效比对比

应用场景与使用指南

典型场景推荐

如何使用 MLPerf 进行快速验证

评论

发表回复 取消回复

更多文章

Adobe Firefly矢量图生成与商业版权说明：设计师的安全创作利器

佳能EOS R1体育摄影自动追焦参数深度解析：专业运动拍摄的终极工具

小米SU7 Nappa真皮座椅日常保养与清洁指南

华为问界M9途灵底盘自适应模式：智能驾控新体验深度解析

发表回复取消回复