バックプロパゲーションアルゴリズムを示しています

 

最近深直接読み取るUFLDLチュートリアルアンドリュー・ウ、中国語版の始まりを見て、物事を見るために学習し、以降のいくつかの場所は、常に非常に明確ではない、と英語版を見て、その後、唯一見ることがいくつかの情報を見つけることがわかりました、問題があることも不思議に私たちは時に導出サプリメントの翻訳翻訳者の公式中国語版が省略されることがわかっていないが、サプリメントは間違っています。実際には、バックプロパゲーション法は、ニューラルネットワークの基礎はあるが、多くの人々は、いつも私が学ぶとき、いくつかの問題が発生した、または式の大部分は、彼らが撤退しますかのように感じることは困難であることがわかり、それは難しいことではありません、チェーンを求めています繰り返し法律に導きます。あなたが式を見たくない場合は、直接、非常に簡単にそれを見つけるだろう導出式、後に再び何このプロセスを理解するために、値が、実際の計算に持ち込むことができます。

  ニューラルネットワークといえば、私たちは、この数字は不慣れではありません参照してください。

  これは典型的な3層ニューラルネットワークの基本的な構成で、レイヤL1は、入力層であり、レイヤL2が隠されている層、レイヤL3が隠されている層が、我々は今、データの手{の束を持ってX1、X2、X3、...、 XN}が、また、データ出力{Y1、Y2、Y3の束は、...、YN}が、彼らは今、あなたのデータを取得した後、所望の出力に充填すること、隠された層に何らかの変換をしたいです。それは、最も一般的な自己コーディングモデル(オートエンコーダ)であるとして、あなたは、あなたの出力と元の入力をしたい場合。求めることができるいくつかは、なぜ、入力と出力が同じである必要がありますか?利用ああとは何ですか?実際には、などの画像認識、テキスト分類、中には非常に幅広いアプリケーションが使用され、私は特別のようないくつかの変異体を含む記事を、説明するために自動エンコーダーを書き込みます。あなたのオリジナルの入力と出力が同じでない場合、それは非常に一般的な人工ニューラルネットワークであり、生データの相当マップを通じて私たちが望む出力データを取得するために、つまり、我々は今日の話題について話しています。

  この記事では、直接の例を与え、書き込みへの書き込みオートエンコーダ次回まで逆伝搬法、式の導出のプロセスに価値を示す、実際には、非常に単純な、興味のある学生は、下の自分を引き出すために試すことができます:)(注:この記事は完全に理解している場合、あなたはまだ書かれてノートに投票を参照することができ、基本的なニューラルネットワーク構造を知っている前提としています[Mechine学習&アルゴリズムニューラルネットワークインフラストラクチャ)

  あなたは、このようなネットワーク層を持っていると仮定します。

  第一层是输入层,包含两个神经元i1,i2,和截距项b1;第二层是隐含层,包含两个神经元h1,h2和截距项b2,第三层是输出o1,o2,每条线上标的wi是层与层之间连接的权重,激活函数我们默认为sigmoid函数。

  现在对他们赋上初值,如下图:

  其中,输入数据  i1=0.05,i2=0.10;

     输出数据 o1=0.01,o2=0.99;

     初始权重  w1=0.15,w2=0.20,w3=0.25,w4=0.30;

           w5=0.40,w6=0.45,w7=0.50,w8=0.55

 

  目标:给出输入数据i1,i2(0.05和0.10),使输出尽可能与原始输出o1,o2(0.01和0.99)接近。

 

  Step 1 前向传播

  1.输入层---->隐含层:

  计算神经元h1的输入加权和:

神经元h1的输出o1:(此处用到激活函数为sigmoid函数):

 

  同理,可计算出神经元h2的输出o2:

  

 

  2.隐含层---->输出层:

  计算输出层神经元o1和o2的值:

  

这样前向传播的过程就结束了,我们得到输出值为[0.75136079 , 0.772928465],与实际值[0.01 , 0.99]相差还很远,现在我们对误差进行反向传播,更新权值,重新计算输出。

 

Step 2 反向传播

1.计算总误差

总误差:(square error)

但是有两个输出,所以分别计算o1和o2的误差,总误差为两者之和:

 

2.隐含层---->输出层的权值更新:

以权重参数w5为例,如果我们想知道w5对整体误差产生了多少影响,可以用整体误差对w5求偏导求出:(链式法则)

下面的图可以更直观的看清楚误差是怎样反向传播的:

现在我们来分别计算每个式子的值:

计算:

计算:

(这一步实际上就是对sigmoid函数求导,比较简单,可以自己推导一下)

 

计算

最后三者相乘:

这样我们就计算出整体误差E(total)对w5的偏导值。

回过头来再看看上面的公式,我们发现:

为了表达方便,用来表示输出层的误差:

因此,整体误差E(total)对w5的偏导公式可以写成:

如果输出层误差计为负的话,也可以写成:

最后我们来更新w5的值:

(其中,是学习速率,这里我们取0.5)

同理,可更新w6,w7,w8:

3.隐含层---->隐含层的权值更新:

 方法其实与上面说的差不多,但是有个地方需要变一下,在上文计算总误差对w5的偏导时,是从out(o1)---->net(o1)---->w5,但是在隐含层之间的权值更新时,是out(h1)---->net(h1)---->w1,而out(h1)会接受E(o1)和E(o2)两个地方传来的误差,所以这个地方两个都要计算。

 

计算

先计算

 

 

同理,计算出:

          

两者相加得到总值:

再计算

 

再计算

最后,三者相乘:

 为了简化公式,用sigma(h1)表示隐含层单元h1的误差:

最后,更新w1的权值:

同理,额可更新w2,w3,w4的权值:

  这样误差反向传播法就完成了,最后我们再把更新的权值重新计算,不停地迭代,在这个例子中第一次迭代之后,总误差E(total)由0.298371109下降至0.291027924。迭代10000次后,总误差为0.000035085,输出为[0.015912196,0.984065734](原输入为[0.01,0.99]),证明效果还是不错的。
————————————————
原文链接:https://blog.csdn.net/Super_Json/article/details/85019124

发布了128 篇原创文章 · 获赞 21 · 访问量 3万+

おすすめ

転載: blog.csdn.net/Bluenapa/article/details/103046338