标签: 端侧智能

  • OPPO Find X8系列将首发搭载自研影像芯片和AI大模型

    OPPO今日宣布,即将发布的Find X8系列将全球首发搭载自研影像芯片“马里亚纳X”与端侧AI大模型,实现计算摄影与智能交互的深度融合。该系列配备超感光三摄系统,依托自研芯片的实时图像处理能力,暗光环境拍摄画质提升超60%,同时支持4K夜景视频降噪。端侧AI大模型则提供语音实时翻译、智能构图建议、相册语义搜索等功能,无需联网即可快速响应。OPPO影像产品总监表示,这一技术组合将重新定义移动影像的算力标准,为用户带来专业级创作体验。

    来源:OPPO官方新闻

  • 小米澎湃OS发布AI大模型端侧运行优化方案 隐私与性能双升级

    小米公司今日正式宣布,其自研操作系统澎湃OS(HyperOS)已完成重大升级,推出针对AI大模型的端侧运行性能优化方案。该方案通过深度整合NPU(神经网络处理单元)与CPU调度策略,显著提升了百亿级参数模型在手机端的运行效率,同时确保用户数据完全本地处理,无需上传云端,大幅增强隐私保护。

    据了解,新版澎湃OS在端侧运行AI大模型时,模型加载速度提升40%,推理延迟降低至50毫秒以内,功耗反而下降15%。这一突破得益于小米自研的“端侧智能引擎”技术,该引擎可动态分配算力资源,并根据任务类型自动切换低功耗与高性能模式。在应用场景上,用户将能体验更流畅的AI语音助手、实时字幕翻译、智能图像编辑等功能,且全程离线可用。

    小米集团高管表示,此次优化不仅是技术突破,更是对“AI普惠”理念的践行,旨在让高端大模型能力下沉至更多中端机型。目前,该优化已随澎湃OS 2.0版本推送,覆盖小米14 Ultra、Redmi K70等系列设备。未来还将通过OTA持续升级。

    来源:小米澎湃OS官方网站

  • Unity Sentis 神经网络推理引擎在移动端的集成指南

    Unity Sentis 是 Unity 官方推出的跨平台神经网络推理引擎,专为在移动设备上高效运行 AI 模型而设计。它允许开发者直接将预训练的 ONNX 模型导入 Unity 项目,并在 Android 和 iOS 设备上实现低延迟、高吞吐量的推理,无需依赖云服务器。这一工具为移动端游戏、AR/VR 应用及实时交互体验带来了全新的 AI 能力。

    核心功能与优势

    Unity Sentis 的核心理念是“端侧 AI”,它通过优化算子和内存管理,将模型推理延迟控制在毫秒级。其优势包括:

    • 原生支持 ONNX:无需转换格式,直接导入 PyTorch、TensorFlow 等框架导出的模型。
    • GPU 加速:利用移动端 GPU(如 Qualcomm Adreno、Apple Metal)进行并行计算,显著提升性能。
    • 内存优化:支持动态内存分配和模型量化,降低移动端内存占用。
    • 热更新兼容:模型可随 AssetBundle 动态加载,方便 AI 策略在线升级。

    官方网站:Unity Sentis 官方网站

    典型应用场景

    实时图像识别与分类

    在移动端相机应用中集成图像分类模型,实现对象检测、缺陷识别等功能,响应时间可控制在 30ms 以内。

    自然语言处理与语音交互

    利用轻量级 Transformer 模型(如 MobileBERT)进行文本分类或意图识别,结合语音输入打造离线语音助手。

    增强现实与游戏 AI

    在 AR 场景中实时分析环境语义,或为游戏角色提供行为决策模型(如强化学习策略),实现无服务器的智能体验。

    集成步骤与注意事项

    集成 Unity Sentis 主要分为三步:首先,在 Package Manager 中安装 Sentis 包;其次,将 ONNX 模型置于 Assets 文件夹;最后,通过 C# 脚本加载并运行推理。开发者需注意模型输入的张量形状需与 Unity 的纹理或数组格式匹配,推荐使用 TensorFloat 数据结构。另外,建议对模型进行量化(如 FP16)以平衡精度与性能。

    针对不同移动平台,Sentis 会自动选择最佳后端(如 Vulkan 或 Metal)。建议在真机上进行 profiling,利用 Profiler 窗口监控 GPU 耗时。对于复杂模型,可启用异步推理避免 UI 线程阻塞。