パドルライトは、高性能、複数のハードウェア、軽量の特徴を有する、パドル端推論エンジンフライ、それはARM CPU、マリGPU、副腎GPU、Huawei社NPU等でフライパドル/ TensorFlow /カフェ/ ONNXマルチピア・モデルをサポートハードウェアの展開に推論、業界をリードする性能を達成。
現在、パドルLiteはちょうど1ヶ月にリリースの公式バージョン2.0.0から、パドルLiteは再び2.1.0バージョンをリリースし、迅速な反復最適化やアップグレードを維持します。
パドルライトのGithubのリンク:
https://github.com/PaddlePaddle/Paddle-Lite
ための前処理ARMライブラリ側の画像前処理、画像は、それができる、追加します
支持例えばNV12_To_RGB、GRAR_To_RGBその他などの複数の色空間変換、
例えば画像の回転、反転、および他のような複数の画像前処理演算のサポート
テンソル画像データようRGB_To_NCHW(テンソル)として変換、及び他のサポート
OpenCVのより関連する機能的特性。BGRの画像の1920x 1080、以下の操作を行います。
- リサイズ:1920x 1080 --540x960
- 回転:1920x 1080は、90度回転させ
- フリップ:XYに斜めの軸を反転
下に示すように、ARMのV7 4つのスレッドのデータとOpenCVの性能比較:
モデルによって予測新しい作物は、ライブラリのコレクションを備えています。開発者は、これによって、予測ライブラリのボリュームを圧縮し、唯一のカーネルと機能で必要とされる特定のOPオンライン予測モデルを複数保持することができます。
最適化のエラーメッセージは、システムは、Androidのネイティブエラーをサポートしています。
基本的な機能のアップグレード
A。新OP
- x86ブレード、Gelu
- x86のスタック
b.opフライパドルバージョン1.6に合わせ、アップグレード
- std ::ベクトル<テンソル>説明形状情報の入力を再構築支援
- スライスのサポートを開始し、テンソルの説明を終了し、TensorList
- lookup_table、新しいオペアンプはlookup_table_v2ある最後の寸法は、1の限界で、元のOPを保持しなければならない削除
- resize_bilinearとresize_nearest、及びテンソルに記載TensorListリサイズ形状情報を増加させ
c。新しいモデル
- x86の増加MobileNetV1、MobileNetV2サポート
d.APIアライメント
- PythonやJavaの、3種類の整列C ++ APIのコア:
- MobileConfigモードの下では、PythonやJavaの、展開シナリオ軽量移動端のための完全なアライメントにC ++インタフェース
- CxxConfigモードの下では、非軽量展開シナリオのための完全なアライメントへのPython、C ++インタフェース
すなわち、定量モデルのアップグレードのサポート
- このようMobileNetV1、MobileNetV2、ReseNt50として飛行訓練パドル定量的モデルの後supportの出力に定量的な方法、
- サポートフライパドルトレーニング方法は、モデルchannel_wise_abs_maxの重量を定量化する方法の降伏権を定量化します
Fライブラリ仕上げ見通し
リフレッシュコアライブラリは、ベース予測ライブラリ(build_extra = OFF)サポートCVクラス9古典的なモデルように3つの量子化モデル、及びtiny_publish(フライパドルネイティブモデルと対応X2Paddleサードパーティ変換モデルを含む)(塩基性)OP&カーネルが含ま動的ライブラリ一定の量を予測しました。次のようにモデルをサポートしています:
-
9古典的なモデルとプロペラ変換モデルフライ:MobileNetV1、MobileNetV2、MnasNet、ResNet50、YOLOv3、SSD_MobileNetV1、U-Netの、SqueezeNet_v1.1、ShuffleNet_v2
-
3 INT8定量的モデル:MobileNetV1、MobileNetV2、ResNet50
パフォーマンスの最適化
連続反復のパフォーマンスの最適化の主流モデル。以下のようにMobileNetV1の例では、前方の性能を維持するには:
改善された実装モデルの性能のARM CPUのconv3x3道、ResNet、SqueezeNetおよびその他のプロモーション。下に示すようにResNet50特性:
コンパイル
X86与CUDA编译时第三方库下载加速 (X86编译相关的第三方库Eigen、MKLML、xxHash改为从百度云地址下载,加速编译过程)
NPU的编译支持华为官方最新版HiAI DDK 310
文档
新增Pass介绍与注册方法文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/add_new_pass/
补齐了 Cxx API文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/cxx_api_doc/
新增CV图像预处理库API接口介绍文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/cv/
新增部署训练后量化模型的使用示例文档:
https://paddlepaddle.github.io/Paddle-Lite/v2.1.0/model_quantization/#%E8%AE%AD%E7%BB%83%E5%90%8E%E9%87%8F%E5%8C%96
Bug修复
修补了一些上个版本中存在的Bug。
あなたはパドルライトについての詳細をお知りになりたい場合は、次のドキュメントを参照してください:
パドルライトのGithubのリンク:
https://github.com/PaddlePaddle/Paddle-Lite
パドルLiteのドキュメントへのリンク:
HTTPS://paddlepaddle.github .IO /パドルライト/
のリンクパドルLiteのデモ:
https://github.com/PaddlePaddle/Paddle-Lite-Demo
パドルGithubのリンクを飛ぶ:
https://github.com/paddlepaddle
696 965 088:あなたは、使用中に問題が発生した場合、それは開発者のパドルLiteの公式QQグループ、グループ番号で技術交流やフィードバックの問題を行うことができます。