天元重オープンソースフレームワークの学習の深さに応じて、オープンコード35万行、単純な開発の4つの特徴

[REVIEW] 2020年3月25日、人工知能、企業国光客運の技術は、オンライン会議、共同創設者兼最高技術責任者（CTO）を開催して、国光客運唐Wenbinは、オープンソースの生産プラットフォーム脳++ AIのコアコンポーネントを発表した - 天元（MegEngineが）。このリリースでは、GitHubの上で公開のApacheライセンス2.0、C ++、CUDAやPythonのコードを含むオープンソースコードの百万約35行の合計に外の世界、に基づいて、アルファ版です。

会議、深い学習の枠組みの研究所天Zhongbo詳細、これだけで正式にオープンソースとしてのシニアテクニカルディレクター国光客運、。

世界開発フレームワーク、開いているビューのオープンソース「天元」AIを追加

天元オープンソースの上にフレームワークを学習深さは時代を繁栄の時間に依存国光客運。

2007年以来Theanoは飛躍的に深い学習の技術と応用、開発の後の10年以上生まれ、深い学習フレームワークた連続反復と進化の過程でもある。一方で、オープンソースの概念が世界規模で人気を得ています、これは人工知能の分野では人工知能の開発環境依存のインストール、展開、テスト、および継続的な反復改善作業の精度とパフォーマンスチューニングが容易に、なり、オープンソースのフレームワークを学習の深さは、プラットフォームと開発者と不可分になってきましたツール。

学界と産業界の共同の努力の下、早期のカフェ、トーチとTheanoから学界から生まれ、今TensorFlowで業界をリードして、Amazonは、MXNet、ビルドPyTorch、マイクロソフト社内のオープンソースCNTKにFacebookの努力を賭けます深い学習エンジンDSSTNE他の深い学習の枠組みの比較的少数。

もちろん、これらの主流の開発フレームワークを学習し、簡単な櫛の深さは、我々は、彼らそれぞれが独自の特徴を持っていることがわかります。

認可の写真

TensorFlow 2015年11月におけるGoogleによる正式にオープンソースには、すぐに深い学習領域が深い学習の枠組みの絶対的な優位を占めるになった、多くの企業が、このようなキビ、Jingdongは、Airbnbなどというように、このフレームワークに基づいた製品を、開発しています。TensorFlow総合的な開発言語やモデルトレーニングサーバ、モバイルデバイスのサポート、それ深い学習フレームワークを使用して最大の業界作ります。

MXNetプロジェクトは、カーネギーメロン大学CMUドゥ・ボー李牧が深い学習のためのこの軽量、ポータブル、柔軟な分散型のオープンソースのフレームワークを作成した時に、深い学習の枠組みAmazonはメインプッシュ公式となった、2015年9月に誕生しましたサポートへのCNNは、RNN、LTSMは、識別および予測だけでなく、自然言語処理、画像、手書きの文字や音声のための優れたツールを提供しています。

Kerasのオープンソースは、2015年11月に、二番目に人気のある深い学習の枠組みへと発展しているので、作成者は、GoogleのAI研究者フランソワCholletです。人工ニューラルネットワークライブラリによって書かれたPythonのオープンソースはTensorflow、CNTKとTheano、設計深度学習モデル、テスト、評価、および可視化アプリケーションインターフェース上位のアプリケーションプログラムとして使用することができ、ゴールはわずか数行のコードがあなたを作ることができるですニューラルネットワークの構築。

2016年、Microsoftは認知ツールキット開発CNTKは、画像処理、手書きや音声認識の問題のための最良の候補として、神経モデルのRNNとCNNタイプのサポートで出てきます。CNTK高性能分散コンピューティングが、ARMアーキテクチャのサポートの欠如は、モバイルデバイス上でその機能を制限しますが。

2017年には、ニューラルネットワークの訓練のためのFacebookのオープンソースのPythonパッケージPyTorch numpyのと類似のLuaベースの学習ライブラリトーチの深さ、から構成されている、非常にPythonはベース、それは簡単で、Pythonの生態系の統合の残りの部分です。PyTorchが大幅TensorFlowに比べて柔軟性が向上し、ダイナミックマップのサポートにより、特に迅速な検証アルゴリズムと再生のために、そんなに学界が好みます。

これらの強力な開発フレームワークでは、AIの開発者は、基本的には、科学的研究やビジネス着陸のためにそれを使用します。しかし、人工知能の分野では、我々が使用するよりやGoogle、Facebookの、マイクロソフト、アマゾンのオープンソースフレームワーク、国内の多くのインターネットの巨人は、この分野での作業を始めているが、まだ現象となっていないがありますが。

2016年までに、インターネットの巨人Baiduのオープンソースのフライパドル（PaddlePaddle） 、おそらく最も影響力のあるAIフレームワークであり、2019年、電気通信巨人Huawei社は、2020年の第一四半期にオープンすることを発表しましたMindSporeが、それ以上のニュースはまだありません。 3月25日には、深い学習フレームワークの研究開発に応じて開く天元（MegEngine）正式にオープン。

主流の深い学習の枠組み、それの特性は何MegEngineの開いているビューと比較すると？

オープンソースコード35万行、天元テクノロジーアーキテクチャの小説のアイデア

唐Wenbinの導入は、この除外はC ++、CUDAやPythonのコードを含むコードの百万約35行、の天元総収入に依存します。

客運唐Wenbin、共同創設者兼CTOとして、

天元は脳++コアコンポーネントとしてのAI業界の枠組みに応じて、実践的な経験を伴う砂漠除外の一つである、です。このオープンソースのために、オープンは天元は完全なアップグレードを持っていたとみなされます。

2014年の初めから、研究開発、2015年にフルに活用、今年3月にオープンソース、オープンビューに現在のすべてのアルゴリズムは、このフレームワーク天元MegEngineトレーニングや推論に基づいています。だけでなく、それは半分空のエンジニアリング、製品として、Daguaiは、AIの競争の舞台に応じてアップグレードしますが、砂漠を下支え砂漠のようにバフを追加ありません。

記者会見、天元プロジェクトの頭だけでなく、砂漠のシニアテクニカルディレクターティエンZhongbo研究所が指摘したように、天元は統合訓練推論、静的および工業用グレードの深い学習フレームワークの動的な団結のセットです。

上から下へ、天元は、5つのレベルに分けることができ、上部をれる界面層算出し、外側に接続PythonとC ++インタフェースをPythonとC ++フレーム二つの言語によって、開発者が使用することができ、プログラミング、ならびにシステム全体設計・開発、トレーニングと推論。

次は、ある層を示す図で機能静的および図の動的なグラフを含みます。

さらに下には、完全に統合されたコアの計算エンジンサポートのこのレベルは、完全に機能する動的、静的およびインターフェイスを果たし得ると、自動誘導機構、マップのコンパイルおよび最適化、。

この階層下の管理の実行は 2つの主要部分、演算部スケジュールから成り、コンピューティングデバイスは、抽象実行フロー、合理的なスケジューリングスケジューラによるこれらの実行フローであってもよく、他のメモリ管理のセットでありますスタティック・メモリとダイナミック・メモリ管理を含むメカニズム。また、このモジュールはまた、言及する価値があるメモリ上の多くの高度な最適化、付属していますとは、メモリ管理の効率が劇的に増加すること、サブリニアスタティックメモリオプティマイザを達成することです。

底部は、システム全体をサポートするコア計算カーネル層オペレータはX86、CUDA、ARMおよびプロコンピュータチップを含む一般的なコンピューティングデバイスをサポートする高性能データベースを含む、請求項を、。一方、層がさらに高性能通信ライブラリ異性体を含み、フレーム全体が大きく列車をサポートするために、分散型大規模マルチノードで使用できるように計算することができます。

どのように簡単な天元開発の4つの特性解析

客運研究所のシニアテクニカルディレクターティエンZhongbo

過去数年間で、国光客運に応じて、開発プロセスに共通する業界の痛みのポイントの多くを満たし、かつ天元戦の重要な特徴は、これらの痛みのポイントの焦点です。

それは、天元あり、包括的で柔軟かつ効率的な統合訓練推理、運動の団結、：4つのコア機能を。

推論の訓練との統合

例えば、痛みのポイントの一つは、研究から生産工程への深い学習は非常に複雑であるが、モデルの精度の様々な段階では、多くの場合、整列することは困難です。

天Zhongboは、伝統的な深い学習開発プロセス、トレーニングのフレームワークと推論フレームワークは、多くの場合、設計、トレーニングフレームワークを実装し、アルゴリズム設計は、アルゴリズムは、最初の訓練支援枠を経由しなければならないとき推論フレームワークは、二段階であるされていることを指摘しました次に、トレーニングのモデル、及び、フレーム推論に新しい表現を受け入れるようにそれを変換するには、フレーム推論は異なるコンピューティングデバイス上で計算しました。

いくつかの力演算子はサポートされない場合がありますので、ここでは、このプロセスは、このようなフレームワークを訓練し、フレームワークを推論として、多くの問題を発生する、変換プロセスの訓練と推論があるでしょう、それは不可能に自動的に変換を完了すること、別々に設計されて、あなたがする必要があります変換プロセスは、また、最終的なモデルの性能と精度が得られ、冗長なオペレータを多量に導入することができるハンド最適化が満足のいくものではありません。推論は、チップ上の計算問題を入れ、最後のフレームが露出している場合は、しかし、全体の複雑なプロセスので、我々は問題を正確に突き止めることができません。

そのため、デザインコンセプト天元フレームワークは、それが期待され、それが訓練を受けることができているトレーニングと推論1を、するだけでなく、推論できます。

この痛みのポイントに対処するために、推論トレーニング天元統合がうまく解決することができます。

（1）これは、モデルが推論を得るために、トレーニング後に直接使用することができ、モデルを変換する必要はありません。

（2）この機構を介して、速度と推論と一致精度の訓練を確実にします。

完了（3）モデルのトレーニング後、フレームの精度を使用して推論上の異なるデバイスの必要性が（精度の差を最小にするために）のアラインメントを達成するために装置モデルを横断を確保することができます。

（4）簡略化した工程は、内蔵フレーム天元自動化されたモデルの最適化プロセスは、手動処理エラーモデルケースを減らすことができ、自動的に直接構築することができるプロセスは、プロセスを簡略化する、高度に効率的なシステム開発を形成します。

その結果、検討するオンラインサービスとマルチターミナルAI実際の地面の展開の問題は、それが大幅にトレーニングの問題のコストを削減し、解決しました。

ユニティ動き

痛みのポイント2、展開のための静的な画像、ダイナミックなグラフィックスおよびデバッグに簡単ですが、両方を持つことの両方が難しいです。天Zhongboが道路を導入し、深い学習フレームワークは、大きく2つのカテゴリに分類され、一つのカテゴリは静的TensorFlow 1.0深い学習の枠組みで表現され、それは非常に簡単に展開することで、迅速不動産商品のうちの、業界は今、展開が非常に好きであることができ、その高性能、小型のフットプリントが、デバッグが困難。それは研究段階でのデバッグが容易であるため、学界では、我々は、ダイナミックなコンピューティングフレームワークの代表としてPyTorchに好む、そのようなメモリフットプリント、深刻な困難など、より柔軟でなく、動的なグラフィックの欠陥は、最適化を行います。

この魚に直面し、天元戦の設計における運動効果の統一を達成するために期待して、両方のフレームワークの利点を統合するための両方の問題、オープン応じて試してみることができません。

図は、静的スイッチにダイナミックから天元コードフレームを示しています。Pythonのデコレータの実装を使用して@traceを飾るために、この機能が正しく実行両方のダイナミックを含み、それはまた、静的な形態の操作の状態に変換することができるいくつかの機能を、見ることができます。単に「有効」スイッチがTrueまたはFalseに設定され、ユーザーが自由に動的または静的な計算を選択することができます。

このように、開発者は、動的なプロセスでは、非常に簡単に開発およびデバッグをプロトタイプすることができますが、本番で使用する、またはより良い静的オプティマイザ、静的コンパイル機構速度に期待したときに、静的を利用することができます図スピード。

天Zhongboは試験で、と言った静的速度はしばしば促進効果の5％〜20％に達することができる時間保存し、効率を向上させます。

包含的

学術交流を行う人々につながった、第三痛いポイントはたくさんのフレームが存在しますが、インターフェースを使用して、各フレームが異なっている、私たちはまず、それが使用されても、必要な共通のフレームワークを達成することであるかを理解しなければなりません環境とフレームワークと平均開発者に関する再モデルの実装は、高価な事件です。

そのため、問題を簡単にするために、天元の希望は、それはまたして設計された包括的なシステム。

深いスタイルとPyTorch numpyのは非常に似て書かれているフレームワークのコードを、学習ショー天元の使用上の写真は、簡素化APIのPython的Pythonのスタイルは、設計の詳細や関数のパラメータで自然に受け入れへのユーザー、そのように命名スタイルを可能に伝統のオリジナルPythonコミュニティのために尊重します。

それは、開発者が便利に直接フレームワークに、このようなPyTorchモジュールとしてこれまでに書かれたモジュールとすることができるように、天元はまた、実験的な機能を提供することを言及する価値がある、天元およびその他のコンポーネントは、より良いに一緒に使用しましたモデル再現します。

また、天Zhongboが言及した、国光客運は、コンピュータビジョンの分野で蓄積されたいくつかのユニークなビジュアルを持っており、天元システムにこの分野での成果のため、統合、コンピュータビジョン、特別に最適化されたオペレータの数を統合し、コンピュータビジョンの研究をしましょう簡単に。

柔軟かつ効率的な

痛みは、制作会社のためにAIに、四ポイント、各デバイス上の究極でのパフォーマンスを達成するための必要性を装備し、シナリオの多くに直面する可能性があります。

フレームワークの設計では、天元は、最高のパフォーマンスを得ることができ、アルゴリズム、多くのデバイス上にあるように柔軟で効率的なの原則を守ります。次に、水平フレーム良い推論複数の比較トレーニング性能比較天Zhongbo図放出、。

結果は、CPU推論シーンにおいて、天元が高いトレーニングのパフォーマンスおよび推論プロセスを維持すると同時に、缶トレーニング、で有意に改善された性能と利点を有することを示します。私たちが望む場合はまた、より良いアルゴリズムは、さまざまなデバイスに展開、またはアルゴリズムより多くの種類をサポートするために、より大きな既存の機器トレーニングモデルを活用するために訓練で、オンチップ・メモリ・デバイスやメモリ使用量が鍵です要因。だから、また、メモリ天元の懸念を保存します。

天元ができ非常に効果的なメモリ最適化戦略構築された非常に多くのモデル、より多くのサポートアルゴリズムを訓練することができ、同じデバイス上に実装され、トレーニング中にメモリ使用量を削減します。

また、このような直鎖アルキレンメモリの最適化などのメモリと速度の最適化メカニズム天元の多くは、あります。それは、図天元の動的能力の使用に見出すことができ、32のバッチについて計算サポートすることができ、静的ピクチャに変更した場合、64バッチを算出するサポートすることができます。だから、あなたは、この場合、より大きなバッチおよびモデルのトレーニングにしたい場合、ここでは、サブリニア自動メモリ最適化技術の速度を計算する際に持つほとんど256バッチの訓練能力を達成するために、前提を削減されていないことができ、かつモデル大型、その結果、より良い、より深いです。

天Zhongboは、内部評価で、天元が達成できることを言ったの20倍以上、いくつかの大規模なモデルのトレーニング保存メモリを、そして速度はほとんど変化しません。

これらの特性は、天元の配備できる業界に実験室のプロトタイプから時間のクラスの変換製品を達成する能力だけでなく、大規模な、柔軟なトレーニングを行い、学術開発の最前線でトップ研究チームをサポートしています。

このように、天元は行うことができ、本当に、「訓練は外に移動」、「よく訓練」体験に開発が可能、「シンプルな発展」を「トレーニング速く。」

シークレット天元「過去と現在」、初めての露出のためのR＆Dのロードマップ

Theanoからソースとして反復は0-1の研削加工の研究所からのチームとして、砂漠の後ろに、本日発表MegEngineアルファ版、天元ハードウォンの誕生に進みます。

国光客運の心を応じて世界を変える技術を使用して、伝統的な産業で使用されるコンピュータビジョンを設定することです。深さ2013研究が出現したときは、清華大学の寮はそう公式に応じて、顔認識検出アルゴリズム、センセーショナルなアルゴリズムのパフォーマンスのセットを開発し、2週間のインターンに取りつかれ国光客運は、すべての神経回路網を解くました道路の問題。

最初に、オープンは、Theanoフレームワークを書かれたモデルコードに応じて、ニューラルネットワークを訓練が、より大きな訓練とネットワークは、ますます複雑、非効率的で時間のかかるいくつかの大規模な牛の会社では、それはフレームワークの崩壊では、他の方法を考え始めました。

2013年の終わりまでに、国光客運曹操Zhimin、研究開発の頭の時間によっては、自己循環システムアプリケーションにアルゴリズム開発から実現することができますあまりにも多くの人手と時間の投資を必要とせず++研修やビジネスの自動化アルゴリズム開発されたシステムのサイクルを介して取得できるデータのセットを作成することを提案し（以前の脳++に依存クァン）が想定されます。その後、初期の2014年に、深い学習の枠組みの自己開発など、砂漠の初版は、誕生しました。

実行中のオープン標準、後に、半ば2015年にはすべての操作で内部自己開発フレームワークの完成として、同社のビジネスモデルは、研究の枠組み訓練されたバージョンからのすべての行を変更しました。

2015年11月9日、Googleの正式リリースされ、オープンソースTensorFlow、国光客運は、フレームワークグラフを計算する方法を行うために、彼らは同じものであることがわかっによっては基づいていますが、それはまた、自己開発フレームワークとして、砂漠に大きな影響をもたらした、と会社内されています私たちは、自己開発フレームワーク上の不一致に付着し続けたいかどうか。激しい議論と詳細な評価の後、国光客運はTensorFlowの性能に応じことがわかっ遅く我々の数倍よりも理想的な、自己開発フレームワークではなかったです。国光客運は最終的に道路として、自己啓発に付着することを選びました。

それ以来、一定の反復を通して、工業的演習にある間、フレームの底部に加えて、データおよび演算電力インフラの変化に応じて同時に開きます。2013年、研究所に依存国光客運は砂漠に依存して、独自のデータ管理システムMegDataを構築するために始めた、ビジネスデータの爆発で、データ管理の問題が出現し続け、独自のデータチームを設置しました。

2015年の終わりまでに、「まともな部屋」の構築として、砂漠ので、コンピューティングリソースがボトルネックとなっている、天元MegEngineは着実な発展の時期に入っているが、同社は「小さな工房」モード開始は、ビジネスニーズを運ぶことができなかった、コンピューティングプラットフォームの深い学習クラウドを開発スタンドアロンクラスタから移行するために徹底した業務を完了するためにMegCompute、および時間の4分の1しか。

クァンとしてのでクァンビュー・データ、アルゴリズムおよび計算力「ユニティ」の正式な終了の3つのコアコンポーネントをマーキング、包括的なビジネスフレームワークと独自の計算クラスタの自己深さの調査に移動するR＆Dからクァンビュー、AI生産プラットフォーム脳++出始め。

2016年には、開いているビューは、スイート全体の脳++開発プロセスを最適化していき、より大きなチームを構築するために始めた、と2019年にオープンソースの脳++コアフレームワークの深さの調査のための準備を始め、MegEngineは中国名演奏です - 天元を。この期間中にR＆Dチームのフレームワークは、開発者がすぐに開始することができ、再生、再パッケージ化再編に元のコードを経験しているということができます。

準備の年後、天元は最終的に、開発者を有効にする、オープンソースを予定しています。将来、天元最初の暴露天元開発ロードマップに応じて、より多くの計画、会議のサイト国光客運があります。

天Zhongboは、オープンソース天元として、これは砂漠であることを言ったアルファ版、今後の開発計画は、今年は6月にベータ版をリリースし天元は、より加速デバイスのサポートをARMシリーズCPUのサポートを提供するだけでなく、定量化し、低ビットコンピューティングになるとき、サポートは、に月の公式バージョン1.0をリリースし、主流のコンピューティングデバイスの天元戦のサポートは、トレーニング経験を推論のプロセス全体をアップグレードし、最適化するために、より包括的かつダイナミックな能力となります。

彼は、ベータ版と正式版の間に、私は多分天元戦の次の世代は、R＆Dチームとして、砂漠によって行われていない」、より多くの人々がに参加して、コードを貢献することを願っていますし、ベータ版でそれから作成することを言いました公式バージョン、我々はフレームワークを学ぶより良い深さを構築するためにあなたと一緒にそれを願っていますので。」

それを使用する天元良いですか？どのように使用するには？

「魂の質問」リンクの下に入力して、R＆Dの背景とR＆Dパノラマのワン天元アーキテクチャ、技術的な詳細と紆余曲折を学ぼう：除外は本当に使いやすいエンドそれにオープンソースのフレームワークを学ぶの深さに依存？なぜ私は学ぶために回し天元numpyの、TensorFlow、PyTorch、Kerasまたは他のフレームワークに精通し、すでによ？困難なこの学習プロセス？

この点で、天Zhongboは、すべての疑問を払拭、彼は言った、フレーム全体のインターフェースの設計と使用法、過去のため天元の尊重、全体の設計やプロセス改善の枠組みの中で、伝統的なPyTorchの機械学習と数学の習慣で、コンピューティングの利用で、我々抵抗を最小限に抑えるため、使用する方が簡単です。

それは、このリリースの内容はすでに、このようなアウトオブラインの深さの学習ツールMegStudioなどのツールの数が含まれていることは注目に値する、それは簡単に開発を可能にし、迅速天元フレームワーク、綿密な学習や訓練を体験します。

MegStudio操作とデモ

周囲の圧縮および展開ツールは、定量的なツールのモジュールをサポートしていますが、仕上げ続け、誰もが今年半ばでの出会いを期待され、可視化ツールのシステム統合と可視化システムは、より後になります。

オープンソースの文書のメンテナンスでは、天Zhongboはマニュアルとコード能力の基礎を表すと同時に、開発した文書は維持し、文書の品質保証、補正を維持するために一緒に参加するより多くのボランティアを持っていると思っていますことを確認するために、内部プロセスに応じて、開いています。

同時に、天元も提供モデルセンターModelHub、事前研修モデルが一緒にアルゴリズムをリードもたらしますが、プラットフォームに最新の技術や開発の研究所として、砂漠を公開します。国光客運の応じて、よりSOTAモデルが増加していると述べました。

ゼロから、「魚に男を与える」ために「人を与える魚」から、開いているビューフル誠実、オープン脳であることによって++、AIはで、より多くの開発者にVisual Studioの、AI機能のセットを作成しよう学習アルゴリズムの過程で、「錬金術の部屋を」機器の完璧なセットを提供する「錬金術」は、原材料や薪の錬金術として、それがユーザーの需要の自己作成が必要になります。

記者会見で、彼は天元はGitHubの上でコードを管理し、直接それを試してみてくださいどのようにより良い経験に学びたいアドレスとして、砂漠を発表しました！

GitHubの：https://github.com/MegEngine/MegEngine

除外の深さに応じて3分は、フレームワーク天元MegEngineを学んで読み

私はできるだけ早く始めるために試してみたいですか？

あなたは入ることがあり天元公式サイトの体験を

https://megengine.org.cn/