パドルLiteの新しいARM側の画像前処理ライブラリー

パドルライトは、高性能、複数のハードウェア、軽量の特徴を有する、パドル端推論エンジンフライ、それはARM CPU、マリGPU、副腎GPU、Huawei社NPU等でフライパドル/ TensorFlow /カフェ/ ONNXマルチピア・モデルをサポートハードウェアの展開に推論、業界をリードする性能を達成。

現在、パドルLiteはちょうど1ヶ月にリリースの公式バージョン2.0.0から、パドルLiteは再び2.1.0バージョンをリリースし、迅速な反復最適化やアップグレードを維持します。

パドルライトのGithubのリンク:
https://github.com/PaddlePaddle/Paddle-Lite

ここに画像を挿入説明

ための前処理ARMライブラリ側の画像前処理、画像は、それができる、追加します

支持例えばNV12_To_RGB、GRAR_To_RGBその他などの複数の色空間変換、
例えば画像の回転、反転、および他のような複数の画像前処理演算のサポート
テンソル画像データようRGB_To_NCHW(テンソル)として変換、及び他のサポート
OpenCVのより関連する機能的特性。BGRの画像の1920x 1080、以下の操作を行います。

  • リサイズ:1920x 1080 --540x960
  • 回転:1920x 1080は、90度回転させ
  • フリップ:XYに斜めの軸を反転

下に示すように、ARMのV7 4つのスレッドのデータとOpenCVの性能比較:

ここに画像を挿入説明

モデルによって予測新しい作物は、ライブラリのコレクションを備えています。開発者は、これによって、予測ライブラリのボリュームを圧縮し、唯一のカーネルと機能で必要とされる特定のOPオンライン予測モデルを複数保持することができます。

最適化のエラーメッセージは、システムは、Androidのネイティブエラーをサポートしています。

ここに画像を挿入説明

基本的な機能のアップグレード

A。新OP

  • x86ブレード、Gelu
  • x86のスタック

b.opフライパドルバージョン1.6に合わせ、アップグレード

  • std ::ベクトル<テンソル>説明形状情報の入力を再構築支援
  • スライスのサポートを開始し、テンソルの説明を終了し、TensorList
  • lookup_table、新しいオペアンプはlookup_table_v2ある最後の寸法は、1の限界で、元のOPを保持しなければならない削除
  • resize_bilinearとresize_nearest、及びテンソルに記載TensorListリサイズ形状情報を増加させ

c。新しいモデル

  • x86の増加MobileNetV1、MobileNetV2サポート

d.APIアライメント

  • PythonやJavaの、3種類の整列C ++ APIのコア:
  • MobileConfigモードの下では、PythonやJavaの、展開シナリオ軽量移動端のための完全なアライメントにC ++インタフェース
  • CxxConfigモードの下では、非軽量展開シナリオのための完全なアライメントへのPython、C ++インタフェース

すなわち、定量モデルのアップグレードのサポート

  • このようMobileNetV1、MobileNetV2、ReseNt50として飛行訓練パドル定量的モデルの後supportの出力に定量的な方法、
  • サポートフライパドルトレーニング方法は、モデルchannel_wise_abs_maxの重量を定量化する方法の降伏権を定量化します

Fライブラリ仕上げ見通し

リフレッシュコアライブラリは、ベース予測ライブラリ(build_extra = OFF)サポートCVクラス9古典的なモデルように3つの量子化モデル、及びtiny_publish(フライパドルネイティブモデルと対応X2Paddleサードパーティ変換モデルを含む)(塩基性)OP&カーネルが含ま動的ライブラリ一定の量を予測しました。次のようにモデルをサポートしています:

  • 9古典的なモデルとプロペラ変換モデルフライ:MobileNetV1、MobileNetV2、MnasNet、ResNet50、YOLOv3、SSD_MobileNetV1、U-Netの、SqueezeNet_v1.1、ShuffleNet_v2

  • 3 INT8定量的モデル:MobileNetV1、MobileNetV2、ResNet50

パフォーマンスの最適化

連続反復のパフォーマンスの最適化の主流モデル。以下のようにMobileNetV1の例では、前方の性能を維持するには:

ここに画像を挿入説明改善された実装モデルの性能のARM CPUのconv3x3道、ResNet、SqueezeNetおよびその他のプロモーション。下に示すようにResNet50特性:

ここに画像を挿入説明

コンパイル

X86与CUDA编译时第三方库下载加速 (X86编译相关的第三方库Eigen、MKLML、xxHash改为从百度云地址下载,加速编译过程)
NPU的编译支持华为官方最新版HiAI DDK 310

文档

新增Pass介绍与注册方法文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/add_new_pass/
补齐了 Cxx API文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/cxx_api_doc/
新增CV图像预处理库API接口介绍文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/cv/
新增部署训练后量化模型的使用示例文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/model_quantization/#%E8%AE%AD%E7%BB%83%E5%90%8E%E9%87%8F%E5%8C%96

Bug修复

修补了一些上个版本中存在的Bug。

あなたはパドルライトについての詳細をお知りになりたい場合は、次のドキュメントを参照してください:
パドルライトのGithubのリンク:
https://github.com/PaddlePaddle/Paddle-Lite
パドルLiteのドキュメントへのリンク:
HTTPS://paddlepaddle.github .IO /パドルライト/
のリンクパドルLiteのデモ:
https://github.com/PaddlePaddle/Paddle-Lite-Demo
パドルGithubのリンクを飛ぶ:
https://github.com/paddlepaddle

696 965 088:あなたは、使用中に問題が発生した場合、それは開発者のパドルLiteの公式QQグループ、グループ番号で技術交流やフィードバックの問題を行うことができます。

公開された116元の記事 ウォンの賞賛1 ビュー4573

おすすめ

転載: blog.csdn.net/PaddleLover/article/details/103822261