ドライ学習以上の人工知能のための「AI-ming3526」または「この小さなコンピュータビジョン」、機械:検索マイクロチャネル公共数
CSDN:https://blog.csdn.net/qq_36645271
GitHubの:https://github.com/あいみ-CN / AILearners
EDITORIAL
アンドリュー・ウ先生(アンドリュー・ウ)機械学習コースコーセラ上の最初のコースですが、また彼の古典。2011年から2017年までのオンライン・このコースは、このコースは、全世界で180万人の学生を蓄積してきた多くの初心者にAIが学ぶための新しい方法を提供します。
このコースでは、人工知能、への道であると言うことができる「唯一の道。」私は、大学院の研究NLP方向として、でも最初から私は機械学習の原則に今は数学的な意味で論文を読んでいないと、その背後に予備的な理解があり、このコースは私の助けなしで行うことはできません。
感謝網易クラウド教室は私のための学習プラットフォームを提供し、ノートの開始時に、コース名をするアンドリュー・ウ・マシンを学びます。
同時に、字幕のおかげでとの博士ホンハイワイドプラン学習ノートを。
私のノートでは、私はノート博士ウォンを参照し、その当然の観点から理解され、私は、一緒に共有して一緒に学び、共通の進行できるようにしたかったです。
このノートは唯一共有することを学びます!
第一章:知人機械学習
1.1は、機械学習コースへようこそ
機械学習(機械学習、ML)が複数のフィールドであり、学際的、確率論、統計、近似理論、凸解析、アルゴリズムの複雑さの理論と他の科目を含みます。新しい知識や技能を習得するために、コンピュータシミュレーションや人間の学習行動の実現に特化したどのように継続的に彼らのパフォーマンスを向上させるために、既存の知識構造を再編成します。これは、人工知能の中核である、人工知能のアプリケーションのすべての分野を通じて、知的な基本的な方法のコンピュータを作ることです、それは主にではなく、包括的な解釈より誘導の使用、です。このコースでは、機械学習にこのスキルを習得し、自分の機械学習アルゴリズムを実現することができます。
実際には、毎日私たちは多くの機械学習アルゴリズムを扱います
- ブラウザで検索します
- 淘宝網は、あなたが興味があるかもしれない何のためにお勧めします
- Eメールのスパムフィルタリングシステムで
このコースでは、唯一の学習アルゴリズムとマシンを理解するための数学的知識は、実用的な問題を解決するためにあなたができるようにするには十分ではありませんので、我々はその内部の基本を理解するために自分の手を持つことにより、これらのアルゴリズムを達成するために、いくつかの演習を行うには時間がかかります管理。今では科学Python言語のフィールドのデータは非常に暑いですので、私が代わりにオクターブの話のコースの宿題を完了するために、ノートのPython言語を使用します。
なぜそれが今では人気の高い機械学習のですか?それはからです
- 機械学習は、フィールドの外に来ているAI人工知能から開発されました
- 機械学習は、コンピュータには、新しい機能を開発しています
例えば、異なる(AからBへの最短距離を解決するための類似した)従来のプログラミングでは、Web検索、写真のタグの数は、スパムをフィルタリングし、他の作業が簡単なロジックを実装するコードを書くための唯一の人間の方法ではないことができ、これらの機能ができるようにすることです自身がそれを行う方法を「学習」マシンは、これは名前だけのこのコースの起源でマシンが、また、その魅力ではありません!
最後に、我々は機械学習の他のいくつかの例をご紹介します。
-
データマイニング
機械学習、データマイニングのために使用されている理由の一つは、このようなウェブクリックデータ、医療記録、計算生物学、工学の様々なタイプなどのネットワークとオートメーション技術の成長、です。
-
人間がプログラムを書くことができません
ヘリコプター自動操縦例えば、手書き文字認識、自然言語処理(NLP)、コンピュータビジョン。
-
パーソナライズカスタムプログラム
このようなアマゾン、Netflixは、淘宝網、推薦システムのようなiQIYIとして。
コンソール「Hello Worldの!」で見るショーはプログラマの最初のレッスンされている場合は、私が電話オープン淘宝網は、正確な製品エンジニアは、アルゴリズムが最初のクラスで押し込み見ると思います。私たちはこのコースの完了を完了すると、この正確なプッシュの背後にある原理はもはや神秘なると信じていません。
機械学習は間違いなくIT業界で最も人気のあるコンピュータ技術で、私たちは一緒に、AI-支払わための夢と欲望の追求を取ることを学ぶ私たちのマシンを起動してみましょう!
1.2機械学習とは何ですか
機械学習の定義1.2.1
サミュエル・アーサー(1959) :コンピュータは、研究分野を学習する能力を持っているように、特定のプログラムを実行します。
ミッチェルトム(1998) :の経験からコンピュータプログラムE(経験)の研究、課題解決に T(タスク)の性能評価指標を達成するために、P(パフォーマンス)は、によってPで測定されたTためのパフォーマンス上の経験のEが上昇します。例えば、チェッカープログラムでは、経験のEは、そのタスクにプログラムの下でチェスの数万人を表し、Tは、プレイチェッカー、パフォーマンス・メトリックを表しPが相手とチェッカーを再生するときの勝利の確率を表します。
少し練習を1.2.2
メールは電子メールプログラムは、あなたがスパムとしてマークされている受信観察すると仮定します。そのような電子メールクライアントでは、あなたがスパムとして「迷惑メール」ボタン、いくつかの電子メールレポートをクリックし、メッセージが他に影響を与えません。ベースには、より良いスパムをフィルタリングする方法については、ジャンクメール、電子メールプログラムとしてマークされました。し、いくつかに対応する、この設定、E、それぞれP、T、で?
メッセージ分類へ
あなたはスパムとしてマークされたメールを守ってください。
正しく分類されたメッセージの割合
正解E、P、T.です この例を通して、私たちはさらに、機械学習の定義を理解することができるように- 経験を取得した後、T Eの仕事上の業績は、パフォーマンスが向上しますP.
1.2.3一般的な機械学習アルゴリズム
- 教師付き学習:人間特定のことを行うために、コンピュータを「教えます」。
- 教師なし学習:人間は、自分のコンピュータが作る「学びます。」
1.3教師あり学習
1.3.1ケース1:率予報
直線または二次フィット既存のデータに、そして750点の平方フィートの住宅価格のため、予想サイズによって。これは、教師付き学習の一例です。図から分かるように**、教師付き学習では、我々は、データのセット、「正解」のコンポーネントからこのデータセットを与える学習アルゴリズムを指します。**価格のケースでは、我々は適切な価格を与え、各サンプルのデータセットに家にデータの範囲を与え、つまり、彼らの実際の価格は、教師付き学習アルゴリズムの目的は、より多くを与えることです正解は、その家の750平方フィートある価格設定する必要があります。
また、これは回帰である連続値の予測出力の。
1.3.2ケースII:乳がん(悪性と良性)
この例では、解決すべき機械学習問題は、腫瘍が良性又は悪性の確率で推定することで、数1は腫瘍を示し、番号0は腫瘍ではありません。
また、これは分類問題である、すなわち予測出力離散的な値。
しかし、実際には問題に対処する機械学習は、上記の例の腫瘍の大きさ、年齢に加えて、一つの特徴ではないかもしれない、そして以下の実施例に示すように、他の特性は、またしてもよいです。すべての機械学習アルゴリズムはわずか2〜3の機能を処理することができますが、このアルゴリズムは、機能の無限の数を処理することができます。
少し練習を1.3.3
あなたは二つの問題に対処するための学習アルゴリズムを開発したい、あなたが会社を経営しているとします。
- あなたが販売する、同一の財の作品の何千ものを持っている場合ので、あなたは、多くの作品を販売する次の3ヶ月を予測したい、同じ商品を大量に持っていますか?
- あなたは多くのユーザーを持っていますか、あなたは、各ユーザーのアカウントをチェックするためにソフトウェアを書きたいです。各アカウントについて、あなたは彼らが盗まれたかどうかを確認したいですか?
この2つの問題という、彼らは分類または回帰に属していますか?
问题一是一个回归问题,因为如果我有数千件货物,我会把它看成一个实数,即一个连续的值。因此卖出的物品数,也是一个连续的值。
问题二是一个分类问题,因为我可能会用 0 来表示账户未被盗,用 1 表示账户曾经被盗过。所以我们根据账号是否被盗过,把它们定为0 或 1,然后用算法推测一个账号是 0 还是 1,因为只有少数的离散值,所以我把它归为分类问题。
1.3.4 监督学习总结
监督学习,核心在“监督”二字,基本思想是,我们数据集中的每个样本都有相应的“正确答案”,即都被标记。再根据这些“正确答案”对新样本进行“监督”,最后得到预测结果。就像房子和肿瘤的例子那样。同时还介绍了回归问题,即通过回归来推出一个连续的输出,这里还介绍了分类问题,其目标是推出一组离散的结果。
1.4 无监督学习
1.4.1 无监督学习与监督学习的区别及其概念
监督学习的数据集,如上图左1表所示,其中每条数据都已经被标注,例如一个肿瘤是良性或恶性。所以,对于监督学习里的每条数据,我们已经清楚地知道,训练集对应的正确答案。
无监督学习,核心在“无监督”这三个字,我们数据集中的每个样本都没有相应的“正确答案”,即都未被标记,我们将这些数据交给算法,并让算法为我们从中找出某种结构。无监督学习的数据集与我们之前看到的不一样,如上图右1所示,所有数据都没有被标注,即无监督学习中没有任何的标签或者是都具有相同的标签。所以对于一个没有任何标签的数据集,无监督学习算法可以判定该数据集包含两个不同的簇(Cluster)。
同时,这是一个聚类问题。
1.4.2 无监督学习算法的应用
- 新闻网站。新闻网站会用聚类算法将每天收集到的成千上万条的没有任何标记的新闻组合成一个个新闻专题。
- 基因组学。通过聚类算法,在没有提前告诉这个算法什么样的个体是什么种类的情况下,把不同的个体归为不同的类。
- 组织大型计算机集群。
- 社交网络分析。
- 市場セグメント。
- 天文データ解析。
- カクテルパーティーの問題(興味がある学生は多くを学ぶために、クラス4教師なし学習に行くことができます)。
少し練習を1.4.3
使用するのに適している次の例では、教師なし学習算出解決する方法?
- Eメールのデータは、電子メールフィルタリングシステムを訓練、/ないスパムのラベルを与えています。
- インターネット上で見つかった新しい一連の記事を考えると、彼らは、物品のグループの同じコンテンツに付与されます。
- 異なるグループへの顧客データ、自動的にセグメント、および異なる顧客の集合が与えられます。
- 糖尿病患者のためのデータセットのセットが与えられ、その後、糖尿病からの新しい患者かどうかを予測します。
明らかに、前の例では、我々は簡単に解決するために、教師なし学習アルゴリズムに適し2,3と一緒に来て、解決するために、教師付き学習アルゴリズムのために1,4適しことができます。
AIMI-CN AI学習交換基[1015286623] AI、スキャンコードに加えてグループの詳細については:
共有技術、生活の中で楽しい:私たちの公共の番号へようこそ、週AIシリーズのニュース記事をプッシュし、あなたの関心を歓迎します!