記事のディレクトリ
- EDITORIAL 0
- 1はじめに
- 2 DLの基本的なアーキテクチャ
- 3 DL高度なアーキテクチャ
- 4 DL機能
- 5つの使用DLの動機
- クラシックの6 DLおよびML差
- 伝統的な学習から7 DLが異なります
- 8 DLアプリケーション
- バイオイメージング分類(生体画像の分類)
- 画像処理と分類(画像の認識・分類)
- セマンティックセグメンテーション(セマンティック画像セグメンテーション)
- SAR(合成開口レーダ)
- RS(リモートセンシング)
- 人々に再認識(人再識別)
- 物体検出(オブジェクト検出)
- ディープビジョンシステム
- 人間活動認識
- 駐車場システム
- 植物分類
- アコースティック・モデリング(アコースティック・モデリング)
- テキスト分析と認識(文書分析&認識)
- テキスト/ドキュメントの要約
- 音声認識(音声認識)
- ライターの識別
- キーワードスポッティング(ワードスポッティング)
- 音声アクティビティ検出
- アダプティブテスト
- 自動車産業(自動車産業)
- 大規模なデータ(ビッグデータ)
- 株式市場(株式市場の分析)
- データフローグラフ
- 医療用途(医療応用)
- モバイルマルチメディア
- 電力システムの故障診断(電力システム故障診断)
- Wi-Fi(無線ワイヤレスネットワーク)
- スマートシティ(スマートシティ)
- ソーシャルアプリケーション(ソーシャル・アプリケーション)
- 9 DL挑戦
- 9つの結論と今後の展望
EDITORIAL 0
より多くの古典的な2015レビュー持つ学習の深レビュー概観-ニューラルネットワークにおける深い学習、深い要約を行うには、ニューラルネットワークを学習する技術自体からか、自分自身から、このレベルを。2019年の最近のレビューではAディープ学習の実態調査とその応用 -機械学習にA新しいパラダイム、深い学習に今年大流行、レビュー記事は、マクロアプリケーションの現在のレベルから研究より深く学習を紹介しますそして、課題は、テキストのその作者の概要は、本の個人的な理解を中継します。
1はじめに
(以下、DLと呼ぶ)深い学習が実際同様すなわち、テキスト、学習及び訓練は、2つの相をテストする過程含む長手方向に延びる従来の機械学習(以下、MLと呼ぶ)であると言うことができるトレーニングフェーズ(大量の標識が含まをデータとその整合特性をINGのdetermin-)と位相推定する(未露光とその前の知識データを使用して作る結論で新しい新しいラベルをチェックします)。しかし、違いは、古典的なMLは、人工的なデザイン機能や特徴抽出、分類して、学習タスクの必要性があるが、DLは自動的に学習することができますまたは抽出物が特徴とエンドには、いわゆる完成分類ミッション、当然の末端、タスク処理中に古典MLとDLの違いは次のとおりです
、参照が自動的に学習する(表現の学習を)言及することの必要性を学習への道上の特徴を抽出するに行われる学習の質的な理解を示し、私のブログを参照することができます学習する(表現学習)最初の印象。記事は、レビュー研究で言って、次のように理解してください。
表象学習は、入力として生データを取るために、マシンを助け、検出および分類の目的のために表現を決定する方法のセットが含まれています
DLの理解は次のとおりです。
深い学習技術は、表現の複数のレベルを有する方法を学習し、より抽象的なレベルで純粋にそのような種類であります
DLは、古典的な機械学習の多層表現を持っている間に学習するを理解するためのシンプルは、必要または表現される重要な機能を決定するために使用され、DL多層表現は、プレゼンテーションのget(私の理解)から学ぶことができます。mutli-層のそのような表現は、特徴抽出のために使用される非線形素子の数を含んでPythonの深い学習と本もDLに言及し、MLは新しい、より高度な(階層)の方法で異なっていますその深い場所なので、DLは時々深い構造化学習や階層的な学習と呼ばれる表現を、表現します。そのためにも見直し二つの重要な要因のDL方法をまとめたものです。
- 複数の層又は段階で非線形処理。
- 教師または教師なし学習。
第1の要因は、第二は、従来の機械学習と同様であり、非線形及び多層に焦点を当てています。
2 DLの基本的なアーキテクチャ
共通の基本的なアーキテクチャは、次のものがあります。
- エンコーダから(オートエンコーダ、AE)
- 畳み込みニューラルネットワーク(畳み込みニューラルネットワーク、CNN)
- 制限付きボルツマンマシン(制限付きボルツマンマシン、RBM)
- また、凸ネットワーク(深い凸ネットワーク)の深さとして知られているネットワークスタックの深さ(深スタッキングネットワーク、DSN)
- 長期短期メモリ(LSTM)或ゲーテッド再発ユニット
(GRU)ネットワーク - リカレントニューラルネットワーク(リカレントニューラルネットワーク、RNN)
上記DSNに加えて、一般的なネットワークの深さとは異なる詳細な理論的な知識を過ごすための本で見つけることができ、深さDSNは、いくつかの別個のネットワークが含まれ、各ネットワークに対応を有しています隠された層は、次のようにその動作原理を表現することができる。
この基本的な構造の数年間の開発は、以下に示す:
近年では、より人気の、基本的な構造はLSTMとRNNです。
3 DL高度なアーキテクチャ
このようなアーキテクチャについての詳細を学ぶために必要として、下記の高度なアーキテクチャの簡単なセットが、それぞれに拡張することができます。
AlexNet
含むジェフリー・ヒントンは、研究チームを含め、ビッグスリーの一つによって開発されました
ビジュアルグラフィックグループネット
それVGG
GoogleNet
速くVGGよりも、層22は層VGG19を持っています
深刻
兼容性好:ResNetの主な利点は、多くの残留層が訓練されたネットワークを形成することができるということです
ResNeXt
新しいアーキテクチャに基づいていますが、より良いResNet
RCNN(畳み込みニューラルネットワークと地域)
これは、画像及び識別画像に指定されたオブジェクトのオブジェクト上バウンディングボックスの設計に依存します
ヨロ
SqueezeNet
低帯域幅のアーキテクチャでは最も強力です。
祝福
アーキテクチャは、画像分割(画像分割の問題)の問題に対処するのに最も適しています。
BOTH
これは、比較的ユニークなネットワークアーキテクチャですが、また、もう少し人気が近年では、
4 DL機能
ディスプレイ上の元のDL点の多くの特性をまとめ、以下のように要約:
- 純粋にニューラルネットワークに基づいている3つ以上の(すなわち深さ)の
- 学ぶための強力な能力、データをより効率的に利用する必要があり、具体的には、ビッグデータの分野で強い認識を持っています
- 特徴抽出データやデータの高次元の特徴抽出から、いわゆる学習関連の表現、および高レベルの抽象化によって、これらのネットワークは複雑な機能を抽出することができるから学ぶ方法。
- より良いアドレス高強度のコンピューティングタスクのために、それは、より最適化された結果を得ることができるようになります多くの手作業を必要としません。
- 学習ネットワークは、ネットワーク構造の深さ、励起機能とデータ表現、等に依存しています
- より少数のパラメータがデータの事前知識に依存しない、広い特徴(機能)を説明するために使用され得るか、または
- ニューラルネットワークの深さは、大量のデータを表現する新しい方法でマークされていないにもために、データのユニークな表現を持っている
ような決定融合(決定融合)など様々な分野で大きな進歩を遂げてきたDLを行い、これらの機能の、(モバイル機器を車載オンボードのモバイルデバイス)、転移学習、クラス不均衡(クラス不均衡問題)と、このような新たな分野を特定するなどの人間活動。
5つの使用DLの動機
深さは、デジタル手書き認識をプレイすることを学ぶ、とCNNは、この点で大きな成功を収めました。ここでDLを使用するための動機の一部は以下のとおりです。
- DLは、企業内でAIの利用に貢献することができ、DLは、最も基本的な方法であるAI
- モデルの深さは、特に手書き認識、ヘルスケア、画像分類、音声認識や自然言語処理では、4〜5年前の深さのニューラルネットワークを従来の方法を置き換えるために始めたとき、我々は顕著な実績をあげてきました。
- データの次の大きなトレンドについて、深い学習方法は、より正確になります
- NVIDIA、YES!
- (メタ学習)メタは学習、および協調学習の強化学習(敵対と協調学習)に対する将来の焦点になります
クラシックの6 DLおよびML差
:含めたポイント数を、リストされているレビューしたいと思います
- もっとゆっくり訓練DL高いハードウェア要件、
- 大きなデータに適したDL、及び古典MLが少ないデータに適用されます
- DLは抽出自身の学習を特徴とすることができる、それが説明したり理解するのは難しい作品
伝統的な学習から7 DLが異なります
ここでの伝統的な学習(従来の学習)は古典的な例であるべき差は以下の領域で反射され、ML法のクラスを指します。
特徴抽出と表現(表示)
上記のようにDLが簡単に生データから分類機能を学ぶことができ、かつデザインは、伝統的な学習の特徴、キープすることは、人間が必要です
一般化と多様性
機能が自分で勉強しているので、その後、DLの一般化は明らかに高いです
データ準備
またはそのデータを準備するという点で、自分の特性に学ぶことができることは、あまりにも面倒である必要はありませんかさえDLは必要ありません。
モデルのトレーニングと実行時間
オーバーフィッティングを防ぐために、DLはそれに応じてより多くのデータを必要とする通常のGPUアクセラレーション、非常に長い時間を実行します。
8 DLアプリケーション
アプリケーションのDL広い範囲は、次の通り:
1つの導入ずつ下方に、そのような研究プロセスと原則として詳細は、元のレビューおよびその他の情報を参照する必要があります。
まず、画像処理、
バイオイメージング分類(生体画像の分類)
これは、近年、将来的に重要な側面であります
画像処理と分類(画像の認識・分類)
セマンティックセグメンテーション(セマンティック画像セグメンテーション)
SAR(合成開口レーダ)
SARが参照できるウィキペディア表面に浸透する能力のために選択され、より良好な識別能力を向上させるDLと組み合わされ、海洋側面を監視、災害監視、環境モニタリングのために使用することができます
RS(リモートセンシング)
参照感知Baiduの百科事典は、すなわち、収集電磁波が放射され、反射された遠隔ターゲットの情報が処理され、最終的に形成
人々に再認識(人再識別)
人物の再同定は、異なるカメラから、または異なる機会に同じカメラから撮影した同一人物の画像を関連付けるのタスクです。すなわち、異なるカメラ又は異なるシナリオで同じカメラで同じ個体を同定する、インテリジェントな監視システムを使用することができます。
物体検出(オブジェクト検出)
ディープビジョンシステム
人間活動認識
例えばウェアラブルロボットの歩行認識しばしば出会い
駐車場システム
駐車態様、すなわち、主に画像処理を用いて、オートパイロット
植物分類
その植物分類学
以下は音声学など、意味論とテキストであり、
アコースティック・モデリング(アコースティック・モデリング)
セマンティック認識(音声認識)を含む、など
テキスト分析と認識(文書分析&認識)
テキスト/ドキュメントの要約
音声認識(音声認識)
別の国語とさえ方言を含みます
ライターの識別
つまり、様々なスタイルで異なる書体、または書き込みテキストを識別
キーワードスポッティング(ワードスポッティング)
また、スキャン画像で検索語句の全てを見つけるように、キーワードスポッティングとして知られています
音声アクティビティ検出
ノイズのような分離された音声信号は、例えば
以下は、他の側面であります
アダプティブテスト
一時的に分析
自動車産業(自動車産業)
大規模なデータ(ビッグデータ)
これは数年前方向より火事です
株式市場(株式市場の分析)
それは浮き沈み株式の統計的予測に似ています
データフローグラフ
一時的分析のため
医療用途(医療応用)
このように、コンピュータ支援診断、ヘルスケア、生物学的な画像分類(生体画像の分類)、などのために使用することができる医療用画像処理、画像認識、理解、セグメンテーションと融合(画像融合)などの多くの側面を、含まれています
モバイルマルチメディア
すなわち、携帯端末上で深い学習エンジンを使用して
電力システムの故障診断(電力システム故障診断)
Wi-Fi(無線ワイヤレスネットワーク)
そのような通信の精度と安定性を高めるために、エンコーダから使用など
スマートシティ(スマートシティ)
これは、すべての面で物体検出、顔検出など、より包括的なアプリケーションであり、
ソーシャルアプリケーション(ソーシャル・アプリケーション)
等感情分析(感情分析)、など
9 DL挑戦
DLの方法は非常に良いと正確ですが、次のようにまだいくつかの克服すべき課題や欠点が、ありますが。
- 高い計算能力とそれに対応した高性能GPU、問題が投資する必要が高い複雑のためのコストが必要です
- 強い理論的なサポートは、元のレビューで1に、ありませんが、さまざまな複雑な深いニューラルネットワークmod- ELSでの詳細な調査が課題である、ニューラルネットワーク解釈可能であると理解することができます言及しました
- これは、トレーニングデータの多くを必要と
- 簡単には極小問題に分類します
- そのトポロジーとトレーニングパラメータを見つけるのは難しいです
- ネットワークのような深さのネットワークはブラックボックス、難治性の比較であります
- また、また、ポイントとファジーロジックで述べた課題でDLにバインドされています
9つの結論と今後の展望
全体的に、我々の階層DLの層の二つの重要な要素と学習で監督として注意を払うへの最初の必要性。加えて、最適化処理とマルチレベル(層の階層に対応する)のイノベーションを(学習に監督に対応)は、既存のアルゴリズムを学習する学習機械の深さに、すなわち、依存、MLを拡張するようなDLを記憶します。その後、フィールドが深く学んでいるアプリケーションは、デジタル画像処理や音声認識(音声認識)および他の態様の非常に広い、より一般的なアプリケーションになります。最後に、この科学が始まったばかりであるDL、今後数年間で大流行の到来を告げるためにそのようなNLP、リモートセンシングや医療など、より多くの領域、になります。
将来のためのDLビジョンは、次のとおりです。
- どのようにノイズシーンの様々なを含む、複雑な、非静的に適応します
- 機能の多様性を増加させることにより、ネットワークのパフォーマンスを向上させる方法
- そのような強化学習技術の深さと教師なし学習の互換性オンライン環境、
- 高度なモデル生成の深さ(優れた深い生成モデル)、および音声認識システムの時間パラメータのための高度なモデリング機能の開発(のための一時的なパラメトリックモデリング能力高度な
音声認識システムを)。 - でも、自動運転に、ネットワークビデオトラッキングと目標検出の深さを使用します