世界をリードするスマート ターミナル テクノロジー企業として、OPPO はエンド ユーザーに最高のユーザー エクスペリエンスを提供することに尽力してきました。この目標を達成するために、私たちはクラウドや人工知能などの最新テクノロジーをより効果的に活用する方法を常に模索しています。典型的な例は、OPPO が提案した Andes Brain 戦略であり、端末デバイスのインテリジェント化に取り組んでいます。
人工知能は、モバイル デバイスの可能性を解き放つのに役立ちます。一方で、端末デバイス上で AI モデルを実行すると、ユーザー データをクラウドに送信する代わりにモバイル ハードウェア上に保持できるため、ユーザーのプライバシーをより適切に保護できます。一方で、モバイル チップの計算能力は急速に向上しており、より複雑な人工知能モデルをサポートできるようになりました。クラウド プラットフォームと AI モデル トレーニング用のモバイル チップを組み合わせることで、クラウド コンピューティング リソースを使用して、さまざまなモバイル ハードウェアに適応できる高性能機械学習モデルを開発できます。
2022 年に、当社は StarFire を通じて AI エンジニアリング戦略の実装を開始しました。StarFire は、当社が自社開発した機械学習プラットフォームです。このプラットフォームは、クラウド サービス、コンピューティング能力、端末デバイスを組み合わせています。これは、Andes Smart Cloud の 6 つのコア機能の 1 つです」 。アルゴリズム エンジニアは、StarFire が提供するさまざまな高度なクラウド テクノロジーを使用して、エンドクラウド AI モデルの開発および検証要件を満たすことができます。
デバイスサイドAIモデルの開発はエンジニアリングリンクで解決しなければならない重要なリンクであり、StarFireデバイスクラウド統合ワークベンチ(以下、総称してAIワークベンチ)は、その開発と検証を担う重要なキャリアです。 OPPO アルゴリズム エンジニアによるデバイス側モデル。
エンドツーエンド モデルの開発中、エンドツーエンド シナリオの特殊性により、アルゴリズム エンジニアはモデルの効果を確保し、高速で安定した経済的な指標に注意を払うだけでなく、多くのエンジニアリング リンクの問題、特にエンドクラウドの開発コラボレーションの問題を解決します。調査の結果、アルゴリズムにはエンジニアリング側の作業に多くの時間がかかることが判明しました。完全なツールチェーンのサポートがない場合、各 AI 開発ユニットはツールを開発し、独自にデプロイし、リソースを確保する必要があり、これにより、手作業による非標準的な操作が多く、セキュリティ、再利用性、通信とコラボレーションの観点から見て効率が非常に低く、アルゴリズムの開発とテストに多大な問題をもたらします。要約すると、主な問題点は次のとおりです。
-
最終モデルは通常、実行速度を向上させ、遅延と電力消費を削減するという厳しい要件に直面しており、豊富な軽量メソッドを必要とします。 -
定量的な集計プロセスは煩雑であり、USI Search などの方法では詳細なチューニングを実行することはできません。 -
推論エンジンとチップ プラットフォームのモデル適応とアップグレードの最適化は頻繁に繰り返され、手動操作のコストは高くなります。 -
端末モデルの反復開発および展開中の端末クラウドのリソース使用率は高くないため、モデルの反復および展開の効率が制限されます。
上記のビジネス上の課題と課題に対応して、頻繁に使用されるモデルの圧縮、変換とコンパイル、消費電力テスト、パフォーマンス テストをカバーする、エンドツーエンドのモデル、エンド、クラウドの共同開発リンクを実行する StarFire AI Workbench を構築しました。 、x86 クラウドサイド シミュレーションおよびその他のパイプライン機能。
StarFire AI Workbench のアーキテクチャ図
StarFire は、Andes Smart Cloud を利用して、クラウド上でのモデル開発と展開のための比較的完全なパイプラインを構築しました。エンドサイドのシナリオの場合、StarFire AI Workbench は、クラウド側、実マシン、電力消費マシン間のリンクを開くことで、既存のクラウド ワークフローをエンドサイド デバイスと深く統合し、ワンクリックで定量的モデルのコンパイルを実行できます。ワークベンチ、デバイス側マッチング、モデル配布、バッチ検証とテストを経て、最適化後に次の検証に進みます。ワークベンチにより、多くの繰り返し作業を削減し、環境管理や設備管理などの面倒な手順を省略できると同時に、プラットフォームを利用してエンド側の設備を効果的に共有できます。以下では、AI Workbench のいくつかの重要な機能を、上記のビジネス上の課題と組み合わせて紹介します。
端末モデルの開発プロセスでは、端末機器のコンピューティングリソースのサイズと電力の厳しい制約により、モバイル端末モデルは、モデルサイズが小さく、計算の複雑さが低く、バッテリー消費が少なく、柔軟性が高いという条件を満たさなければなりません。アップデートの展開。精度を大幅に低下させることなく元のモデルの圧縮を達成する方法は、学術界と産業界の両方が常に焦点を当ててきた研究分野です。
StarFire AI Workbench 通过集成开源和自研的技术,包括常见的模型量化,模型剪枝、模型蒸馏等,可以支持多种主流深度学习框架的模型压缩,并针对硬件做了定制优化,可适应多种业务场景。同时,我们从算法工程师便捷使用的角度出发,构建了自动化压缩流程,在平台上形成了一站式工作流,极大地提升模型压缩工作的效率,并降低端模型部署时延。
StarFire 中的模型压缩技术
经过理想的压缩之后,端模型需要面向高通和 MTK 芯片的目标平台进行量化与编译工作,算法工程师一方面需要同时学习两个平台的量化编译流程,掌握众多的参数与配置文件,另一方面独立的量化编译工具功能有限(如对噪声的优化和高精度保证),最后还需要进行不同平台不同版本的量化编译环境配置,学习和实践成本较高。
StarFire AI Workbench 模型转换功能通过高效合理的服务封装和简单清晰的界面尽可能降低不同平台量化编译工具的使用成本。
-
易用性 :统一了各版本工具的配置环境,算法工程师无需关注 SDK 的版本和环境,只需要进行页面点选配置好参数就可以完成量化-编译的转换操作。 -
全面性 :具有多种模型量化噪声分析和优化功能,提高量化模型的精度。 -
灵活性:可以点选式配置必备参数,也提供可选填的扩展参数。
AI Workbench 功能界面
功耗测试架构图
算法工程师通过 AI Workbench 提交任务;
获取相关推理引擎环境及配置信息;
量化编译任务调度;
模型结果存储至自研存储 CubeFS;
-
获取相关配置信息,根据测试任务的需求及设备情况将任务调度至对应功耗机; -
推送功耗测试所需的配置文件至端侧设备,结果指标回传至对象存储/数据库中。
端模型基于其应用场景,对性能表现有极致的追求。StarFire 平台自主搭建了端云一体的模型开发和测试链路,支持本地真机的快速接入平台,同时平台内置完全解耦的推理引擎库、脚本库、模型库和运行环境镜像,算法工程师可以自定义地选择,实现对模型库/本地存储的模型转换、编译优化、量化、端侧推理时延和内存占用的性能测试、端云性能的对比。
整体性能测试架构如下图所示:
支持工控机/本地真机接入平台,快速构建定制化的端云协同开发和测试链路;
支持多个模型在单个芯片环境+推理引擎下的端云性能测试;
支持模型转换编译、模型端侧推理结果分析、端云性能对比;
维护了 OPPO 端侧模型开发团队常用的模型库和引擎 SDK;
支持注册工控机上连接的高通/MTK 手机芯片类型;
-
多访问方式 :支持 UI 和 API 接口访问,分别面向单仿真任务的可视化快速执行和工具链 pipeline 中的自由调用。 多任务并发能力:充分利用云侧计算集群的高伸缩性和多线程服务能力,支持 API 接口多任务并发能力;对外提供 python sdk,方便 pipeline 集成。
-
Workbench 将仿真输入信息上传至文件存储; -
基于 OPPO 的虚拟机构建驻守服务,实现与其上运行的 X86 架构成像调试仿真程序交互; -
驻守服务调用 X86 仿真程序进行成像仿真,将结果回传; -
Workbench 将结果下载到挂载的 CubeFS 中; -
仿真记录利用 RDS 存储,记录每次的仿真任务编号及状态,供驻守服务查询和使用。
相对于离线服务器的模式,云化仿真可以充分利用云上可伸缩的海量计算节点,提供更高效的相机调试仿真服务能力:
-
提升仿真效率 :快速通过安第斯智能云调度虚拟机补充仿真算力,提高任务效率; -
降低仿真成本 :任务低峰期释放资源,保留最小资源池,按需使用; -
提供底层运维支撑与技术支持 :节点层面、网络层面、系统层面、应用层面,能够很好支撑仿真任务高效、平稳运行。
StarFire 作为安第斯智能云承接 OPPO AI 工程化战略的重要载体,在 AI 端云协同开发的过程中还会进行更深层次的打磨和建设,包括联邦学习框架、智能端插件、模型管理和监控等。我们也会将更多 StarFire 在 AI 工程化建设中的实践,如算力资源利用率优化、推理功能建设、数据相关建设等,进一步与大家进行交流。
OPPO 安第斯智能云(AndesBrain)是服务个人、家庭与开发者的泛终端智能云,致力于“让终端更智能”。作为 OPPO 三大核心技术之一,安第斯智能云提供端云协同的数据存储与智能计算服务,是万物互融的“数智大脑”。
本文分享自微信公众号 - 安第斯智能云(OPPO_tech)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。