「Vernacular Deep Learning and Tensorflow」Reading Notes 01

ディレクトリ

第1章機械学習とは

1.1クラスタリング

1.2返品

1.3分類


ディープラーニングを始めるにあたって、私は常にビデオチュートリアルの説明に頼っていました。実際、これは科学的なものではありません。現在、ディープラーニングに関連するティーチングビデオはすべて、著名な医師によって説明されています。それでも、あいまいです。結局、ギャップが大きすぎます。何かを学ぶのは難しいです。本やエッセイは正しい学習方法ですが、ほとんどのエッセイは外国のギャングが書いています。英語力には一定の要件があります。工学系の学生として(将来、学業に従事しないため)また、少ないことでより多くを行うには、手を組み合わせる必要があります。

私は現在大学院1年生です。以前はジャバをやっていたのですが、道はありません。人工知能は確かにこの時代のトレンドです。これは避けられないことです。どの業界で働きたいにせよ、人工知能を理解する必要があります。 、現在の流行語の間の接続を簡単に紹介します:ビッグデータ>人工知能>機械学習>深層学習。

そこで、私は今月、「Vernacular Deep Learning and Tensorflow」という本を読み始め、自分の学習記録に関するブログのリーディングノートをみんなと共有しました。この本のpdfをリンクに配置します:https://pan.baidu.com/s/1-6HWhjMif4Klb_rigXqP4g抽出コード:w80n。私は長い間この本を選びましたが、最も簡単な本であると言ってよいでしょう。「ディープラーニングとテンソルフローの原則」などの他の本は実際には良いですが、入門学習には適していません。私もこの本を初めて読んでいるので、2回読んだ後、2回目のブログとしての経験を書くので、ブログの質が高くなります。

第1章機械学習とは

機械学習を理解するには、最初に学部のc / java / c ++言語、データ構造、およびアルゴリズムの2つの学習コースを比較する必要があります。学部のhello worldの最初のコードを覚えていますか?以下に示すように:このコードは非常にシンプルです。これは非機械学習です。コード実行のすべてのステップは私の希望に従って実行されます。つまり、機械には学習プロセスがありません。これを理解した後、次の例を挙げてください機械学習とは何かを説明するため。

public static void main(String[] args){
    System.out.println("HELLO WORLD!");
} 

要望:スパムの分類体系を作るためには、メールを普通のメールとスパムに分ける必要があります。

機械学習以外の実践:たとえば、メールに「ジャックポットを獲得するために8888を再充電する」などのスパムが含まれていると判断された場合など、この機能を完了するためのコードを記述できます。

機械学習のアプローチ:とりあえずこのシステムを分類子と呼びましょう。大量(10G以上)のスパムを与えるのがより適切です。これらのスパムには、トレーニングサンプルと呼ばれる特定の用語があり、スパムに注意を払いますこの分類子は、これらのスパムメッセージの特性に基づいてスパムの分類ルールを決定する分類子です。このプロセスはトレーニングと呼ばれます。トレーニングの方法については、さまざまなアルゴリズムが含まれますが、それらのほとんどは統計的な統計的誘導法です。ルールを判断した後、この分類子に「通常のメール」と「スパム」を渡して、正しく分類できるかどうかを判断します。このプロセスは、検証/テストと呼ばれます。

上記を考えると、与えられたトレーニングデータはマシンにこれがスパムであることを伝え、この機械学習は教師あり学習になり、教師なし学習と呼ばれるタイプがあります。これは、トレーニングデータをマークしないことを意味します。たとえば、上記と同じです。たとえば、トレーニングサンプルを提供する場合、「通常のメール」と「スパム」の両方が与えられ、マシンにそれがどのようなメールであるかを伝えないで、マシンはトレーニング後に通常のメールとスパムを分類します。もちろん、電子メールにはいくつかのエラーがあるかもしれません。エラーはエラーと呼ばれ、この学習方法は教師なし学習と呼ばれます。

1.1クラスタリング

クラスタリング(クラスタリング)は、典型的な「教師なし学習」であり、物理オブジェクトまたは抽象オブジェクトのコレクションを、類似したオブジェクトで構成される複数のクラスにグループ化する分析プロセスです。クラスタリングは実際には複雑ではありません。簡単な例を見てみましょう。下の図に示すように、私が子供の頃、先生はこれがサルであると教えてくれます。動物園に行くと、動物園に行くと成功します。何千ものサルが異なります。Journeyto the Westを見ると、サルの数が増えていて、それらのサルはまだ会話できます。現時点では、このカテゴリをサルとして分類しますが、これらのサルは先生が言ったものとは異なります。ええと、このプロセスはクラスタリングです、つまり、誤ってクラスタリングプロセスを完了しました。

人間は、この帰納と要約の能力を持って生まれてきます。同じような認知の事柄を1つのクラスとしてまとめることができます。お互いに異なっていてもかまいませんが、この「限度」内にいる限り、私たちは心に「限度」があります。内部では、特性は少し異なりますが、それほど害はありませんが、これらはまだこのようなものです。したがって、動物園のサルは、私たちが幼い頃に本のサルとして分類するだけで、ヘビやサルは分類しません。

最も一般的に使用されるクラスタリングアルゴリズムはk平均法です。基本的な考え方は、各ベクトル間の距離(空間内のユークリッド距離またはマンハッタン距離)を使用して、距離から同じカテゴリに属する​​かどうかを判断することです。下の図に示すように、AとBは私たちが知っているサルのタイプを示しています。Cは新しいサルです。Cがどのカテゴリに属しているかを判断するにはどうすればよいですか。距離によると、CはBと同じカテゴリに属すべきであることがわかります。距離が近いため、これがクラスタリングアルゴリズムの基本的な考え方です。

1.2返品

回帰(regression)は、「果物から生じる」プロセスであり、帰納的なアイデアです。多数のサンプルを取得した後、それらの間の関係がどのように存在するかを推測します。これが回帰のプロセスです。研究の分野では、線形回帰と非線形回帰という2つの主要なタイプの回帰があります。

いわゆる線形回帰とは、サンプルの観察と誘導の際に、ベクトルと最終的な関数値が線形関係にあると想定し、その関係を次のように設計することです。

ここで、wとxはそれぞれ1 * nとn * 1の行列であり、wxはこれら2つの行列の内積を指します。具体的には、ボディインデックスと血糖インデックスが線形関係の場合、次のように書くことができます

次に、この方程式の未知数はw1-w5とbです。これらの値を求める必要があります。これらの値が最も適切です。この「適切」を理解するにはどうすればよいですか。つまり、これらのwとbによれば、この式は、血糖値が実際の血糖値に類似していることを示しています。このギャップは損失関数と呼ばれます。この関数を分析してみましょう。wx+ bは予測値、yは実際の値です。前の累積シンボルは、損失が小さいほど良いことを意味します。

非線形回帰と呼ばれる別のタイプの回帰問題があります。より代表的なアルゴリズムはロジスティック回帰アルゴリズムです。これは分類問題の解決策に似ています。ロジスティック回帰と上記の違いは、上記の線形回帰はyが具体的な値は正しいです。yは血糖値を表します。80ml、70 mlの場合がありますが、ロジスティック回帰のy値は通常、次の図に示すように0または1です。実際、線形回帰wx + bは分母にe回配置されます。牙上。

z = wx + bとすると、次の図が得られます

この機能のイメージはこんな感じ

この画像を分析して、ロジスティック回帰の処理内容を確認します。横軸はzで、縦軸はyです。zは負の無限大から正の無限大に変化しますが、yは0と1の間でのみ変化します。このyの値はそれは「はい」と「いいえ」として理解できます。

1.3分類

分類は機械学習で最も使用されるアルゴリズムです。分類アルゴリズムは通常「分類子」と呼ばれ、ブラックボックスに相当します。入口からサンプルをスローし、出口はこのサンプルのカテゴリを返します。たとえば、入り口に猿の写真を投げると、出口に猿という言葉が現れます。

この分類器は初期化されたときにはこの機能はありませんが、多くのラベル付き画像をフィードする場合は、それ自体で合計した後にのみそのような機能があります。

分類問題にはいくつかの概念が含まれます。ここでは、本の例を使用して説明します。たとえば、トレーニングセットのサンプルは1000枚あり、これは1000枚の画像、200枚は猫、200枚は犬、600枚はウサギ、合計3枚です。カテゴリー、私たちはこれらの写真に手動でラベルを付けます:

猫----「0」

犬----「1」

うさぎ----「2」

ワンホットエンコーディングについては、この本で説明しています。簡単に説明すると、この分類子の最終結果は、画像がどのカテゴリに属しているかを示すことです。ワンホットエンコーディングは、出力結果が次のようになることを意味します。

(0、1); "猫":1

(1、0); "犬":0

(2、0);「ウサギ」:0

わかりますかわかりません。猫、犬、ウサギはそれぞれ0、1、2を表しています。それらの値は1、0、0です。猫が1で、その他は0であるため、この結果が猫であることを示します。わかりました。説明を続けます。猫の200枚の写真のうち、180枚は猫として正しく識別され、残りの20枚は犬です。200匹の犬はすべて正しく識別されます。600匹のウサギの写真のうち550枚は正しく識別され、30枚は猫として誤って分類されます。 20枚の写真が犬と誤って判断されましたが、これは機械学習では正常です。

さて、2つの概念が出てきました:再現率と正確率。猫:180のうち200が正解で、再現率は180/200 = 90%です。犬:犬の写真を取得すると、200が準備され、40が誤って判断されているため、犬の精度は200/240 = 83.3です。 %。機械学習の一般的なルーチンは次のとおりです。機械学習の問題は一般に分類と回帰です。このタイプの問題を実行する一般的な手順を次の図に示します。


 

 

 

元の記事を111個公開 60のような 70,000 +ビュー

おすすめ

転載: blog.csdn.net/Haidaiya/article/details/85632794