日06:画像処理ツール - 畳み込みニューラルネットワーク(畳み込みニューラルネットワーク)

畳み込みニューラルネットワーク(畳み込みニューラルネットワーク)


「ナチュラルユーザーインターフェース」(ナチュラルユーザーインターフェイス、NUI)

人工知能のこの波は自然なユーザー・インターフェース(ナチュラルユーザーインターフェイス、NUI)の画像(画像、動画)、音声(ボイス)とテキスト(テキスト)識別、生成、分析を含む画期的は、機械を通して、そこにあります、本製品に接続する機能を、通信するユーザーだけでなく、より多くのアクセスと対話するために、だけでなく、具体的には、周囲の環境に、より合理的な、より多くの知恵、判断力や反応をするために、この生来の人間の能力を持っていました製品のアプリケーション開発は、ように無人航空機、無人偵察機、スマートホーム(スマートホーム)、製造ロボット(ロボット)、ボット(チャットボット)...とを含む無限の発展の可能性を、持っています。
当初から、一つ一つは、我々はわずか数行を識別するために、10桁の数字を使用する前に、イメージ(画像、動画)、音声(ボイス)、テキスト(文字)相関アルゴリズムを探求する必要があるので、私はその後、ちょうど興奮していましたダウン、別のアルゴリズム「畳み込みニューラルネットワーク」(畳み込みニューラルネットワーク、CNN)を導入 、 「特徴抽出」(特徴抽出)、その結果、画像認識アプリケーション及び自然言語処理(NLP)で、また、原因」に自動的にすることができます畳み込み層「(コンボリューション層)の概念を導入し、それは非常に効果的に負荷ニューラルネットワークの訓練を減らすことができます。

畳み込みニューラルネットワーク(畳み込みニューラルネットワーク、CNN)

CNNはまた、人間の脳の認知は、例えば、私たちは絵を識別し、それが最初の明るい点、線、面の色に気づくでしょう仕方、その後彼らは構成を明確な形(目、鼻、口...)、模倣ました抽象化の種類は、道CNNアルゴリズムモデルを確立するプロセスです。畳み込み層(畳み込み層)が次第に統合スタックの比較結果を通じて判断ブロック特徴アラインメントにローカルポイントターン、の比であり、図は、以下のように、良好な認識結果を得ることが可能です。
https://ithelp.ithome.com.tw/upload/images/20171206/20001976ks1ZnVMOYD.png
図CNNのコンセプト出典:.畳み込み神経の直感的な説明ネットワーク

コンボリューション層(コンボリューション・レイヤー)

どのように我々はそれの表面にポイントから電源を入れていますか?それは、N×N個の格子点を中心に表面を構成しながら、単に中心として各点の画像である(Nは、重量のN x N行列の再いわゆる「ボリュームカーネルサイズと呼ばれますそれはコンボリューション(CNN層の畳み込みである画像の最後の時点まで、次に移動するようにコンボリューションカーネル「)、各セルを同様に処理し、この時点出力として、加重和を計算し、異なる重みを与え、そしてレイヤ)、図を参照してください、CS231n:記事の視覚認識のためのコンボリューションデモ段落畳み込みニューラルネットワークは、イラストサンプリングの方法によって、アニメーションのファッションです。畳み込みレイヤ処理及び画像処理方法と類似の方法では、異なる重みの「畳み込み」組換えを投与することにより、スライディングウィンドウ(スライディングウィンドウ)計算を用いて、エッジ、コーナーの形状を検出するだけでなく、雑音(ノイズ)を除去することができシャープ(シャープ)回帰の欠点を克服識別のための基礎として、これらの特徴の抽出の効果、(回帰)は「外れ値」(外れ値)によって影響される真剣投機の結果に影響を与え、長い鼻を持つ男のようなモルは、我々は、それが鼻の形状に基づいていることを識別することができるはずです。
https://ithelp.ithome.com.tw/upload/images/20171206/200019764fPvV5vbGn.png
図畳み込み層(コンボリューション・レイヤー)動作モード出典:. CS231n:畳み込みニューラルネットワークのための視覚認識

若不引入卷积层,使用单纯的隐藏层(Dense),即第二篇的作法,不仅需要很大的内存,计算也会耗费很长的时间,我们看一个真实的案例,ImageNet 2012 挑战赛的题目,辨识 227 x 227 点的全彩图案,每一点R/G/B各占24 bits,故输入层单一张图的数据量就有 227 x 227 x 96,假设有60,000个样本,隐藏层输出1000个变量,那矩阵运算就是(60000, 227 x 227 x 96) 与 (227 x 227 x 96, 1000)的内积,那是一个多么庞大的循环运算。而卷积层的概念是假设我们在看一张图时,每个神经元只会接收一小块区域的反射光线,称为‘感受野’(receptive field),也就是说,隐藏层的神经元只会连接上一层‘感受野’内的Input(11x11),而不会连接‘所有’的Input(227x227),称之为‘局部连接’(Locally Connected),而非‘完全连接’所有 Input。
https://ithelp.ithome.com.tw/upload/images/20171206/20001976qngwkb1dnN.png
图. ‘完全连接’(Fully Connected) vs.‘局部连接’(Local Connected),图片来源:CS231n Convolutional Neural Networks for Visual Recognition

每个隐藏层的神经元就只跟Input矩阵(11, 11)作运算,运算负担就明显减轻了,另外,还有一个假设,称为‘共享权值’(Shared weights),就是每一个‘感受野’对下一隐藏层均使用相同的一组权重(Weight Matrix),请参阅下图,这样要推估的权重数量减少,又可以减轻运算的负担,所以,运用卷积层的目的就是针对图像或语言的特性,简化计算的过程,进而缩短运算的时间。
https://ithelp.ithome.com.tw/upload/images/20171206/20001976Fi8bleLow0.png
图. ‘权值共享’(Shared weights),图片来源:What exactly is meant by shared weights in convolutional neural network?

在使用卷积层函数(Conv1D、Conv2D、Conv3D...)时,我们可以设定滤波器(Filter)的数目,系统在训练的过程中,就会根据Input图形,帮我们找出图中出现的各种形状滤波器(Filter),例如(+、X、O...),再往下加几层卷积层,我们就可能找出图像会包含的各种特征,例如,眼睛、嘴巴、鼻子等,我们来看卷积四次的滤波器(Filter),图片来源为 https://cs.nyu.edu/~fergus/drafts/utexas2.pdf ,第一层只侦测到线,到了第四层,就几乎得到整个轮廓了。
https://ithelp.ithome.com.tw/upload/images/20171206/20001976R3o43jBPr2.png
图. 第一层滤波器(Filter)。
https://ithelp.ithome.com.tw/upload/images/20171206/20001976ErhREDupYr.png
图. 第二层滤波器(Filter)。
https://ithelp.ithome.com.tw/upload/images/20171206/20001976NX1pYtnkcr.png
图. 第三层滤波器(Filter)。
https://ithelp.ithome.com.tw/upload/images/20171206/20001976ig5SL4Evbr.png
图. 第四层滤波器(Filter)。

池化层(Pooling Layer)

典型的にはプラス層間のプールされた層(層プーリング)畳み込み、サンプリングの方法は、スライディングウィンドウとした、方法に関する圧縮された画像情報を保持することが重要であるが、典型的には最大値(最大プーリング)を取り、そして非加重和は、スライディングウィンドウサイズが2に設定されている場合、「スライディングステップ」(ストライド)は、データの量は、元の1/4に低減され、また2であるが、最大値ので、ローカルエリア比に保持されます最尤。つまり、「」これらの機能の有無絵は絵であっ一貫した機能があり、そしてないかどうかより集中された後、情報のプールでは、CNNは、機能場所を気にせず、画像の特定の機能を含めるかどうかを判断するのに役立ち、このような画像シフトは、同じことが(テキストの一部が自己畳み込みニューラルネットワーク製品の動作原理を引用)を同定し、単離することができます。

https://ithelp.ithome.com.tw/upload/images/20171206/20001976muBoxxCMbE.png
畳み込みニューラルネットワークを理解する初心者のためのガイド:図マックス・プーリング、ウィンドウサイズは、また、方法2、ソースをサンプリング「ステップ」(ストライド)2であります

エピローグ

多層畳み込み/プーリングを介して、入力として、特徴抽出、複数の層に完全に接続し、その後、分類、これはCNNの典型的な慣行である、次の我々はアラビア数字の識別を行うためにCNNを使用します異なっているかを確認するために、すぐに、我々は唯一の分類のためだけではなく、ニューラルネットワークを示し、2つのCNNのアプリケーションを紹介します。

これらの概念は、大きな助けの実践に従わなければならない理解し、関連Benpianのアプリケーションが密接にリンクされた後、患者読書してください。
明日は会いました!

 

オリジナル:大列  日06:画像処理ツール-畳み込みニューラルネットワーク(畳み込みニューラルネットワーク)


おすすめ

転載: www.cnblogs.com/petewell/p/11489757.html