(6)機械学習は、はじめに学習指導しました

A.教師付き学習

タグ付きデータのセットを使用して、出力マッピング入力から学習の目的は、マッピング関係は、次に、分類または回帰に、未知のデータに適用されます。
カテゴリー:出力は、分類タスクのためのタスクを学習し、離散的です。
戻り値:出力はリターンミッションのための継続的な学習課題です。

学習のII。分類

次のように入力します(また、観察や評価として知られている)のトレーニングデータタグのセットがありますが、ラベルが部署カテゴリのこれらのデータ(観測)を示しています。
出力:新しいデータ(非学習データ)があるデータのこのセット、のための分類器を学習し、あなたのモデルパラメータを訓練、訓練データに基づいて分類モデルを使用して、送信するための入力として、これらの新しいデータを設定することができ、カテゴリを判断する必要があります学ぶための分類子が決定されます。

学習の(1)分類 - 評価

•トレーニングセット(トレーニングセット):名前が示唆するようにモデルを訓練するために使用は法律を見つけ、モデルを構築するために使用されるデータをラベル付けされています。
•テスト・セット(テストセット):データがすでにマークされ、通常の練習は、評価モデルを学習し、実際のラベルで結果を比較することにより、訓練されたモデルに配送ラベルを非表示にすることです。
トレーニングセット/テストセットの分割方法:既存の注釈データによるとは、ランダムにトレーニングデータとしてデータの一部(70%)のデータを選択し、残りのテストデータとして、交差検定法に加えて、この方法は、自己分類モデルを評価するために使用されます。

学習の評価基準(2)分類

正解率:正解率が(2クラス、例えば)我々の結果の用語について予測される予測を表す実際の陽性サンプルであるどのくらいの陽性サンプルです。次いで、予測が正、正のクラスの2つの可能性(TP)がクラスは正の予測されるが、他方は負のクラス予測は、正のカテゴリ(FP)、であり
、です

リコール:私たちの元のサンプルの目的のために、それが正しく予測されているどのように多くのサンプルの肯定的な例を示しています。二つの可能性があること、一方は、他方が元の正のクラス予測は負カテゴリ(FN)、であり、正のクラス(TP)を正クラスの元の予測され

正クラスのクラスのためのポジティブ見通し:私たちは60個の陽性サンプル、40サンプルの負を持っていると仮定し、我々は、分類アルゴリズムは、実際の陽性サンプル、TPでわずか40そのうち、50を見つけるために陽性サンプルのすべてを見つけたいです番号40; FN:正のクラス予測ネガ型番号20; FP:正のクラス番号10について陰性クラス予測; TN:陰性クラス予測は陰性クラス数30
の精度(正確さ)=予測/すべて=ペア(TP + TN)/(TP + FN + FP + TN)= 70%の
正解率(精度)=
リコール(想起)=

(3)Sklearnは、分類機能を提供します


•K最近傍(KNN)
•ナイーブベイズ(naivebayes)、
•サポートベクターマシン(SVM)、
•決定木(ディシジョン・ツリー)
•ニューラルネットワークモデル(ニューラルネットワーク)など
•この1つは線形分類器を持っている、非線形があります分類器。

アプリケーション(4)分類アルゴリズム

金融:ローンを承認するかどうかを評価するために
、医療診断を:悪性か良性である腫瘍を決定し、
不正検出:銀行取引詐欺かどうかを判断する
判断のカテゴリページ、金融やエンターテインメント:ページカテゴリ?

III。回帰分析

回帰:関心の研究者の変数を予測するために、特定の変数を観察するために、その研究と数学モデルに関連する2つの以上の変数、強度と方向との関連性を理解することを目的とした統計データの分析方法、。回帰分析は、ヘルプの人々は、従属変数独立変数の変化量を把握することができます。一般的に、回帰分析によって、我々は独立変数、従属変数の期待によって与えられた条件を推定することができます。

 

(1)回帰関数Sklearnが提供しました

相関関数は、2つの主要なサブモジュールにカプセル化され、そしてsklearn.linear_model sklearn.preprocessingあるれます。
含む線形回帰関数を用いて、パッケージのいくつかの線形関数をsklearn.linear_modlel:
•一般的な線形回帰関数(線形回帰)
•リッジ回帰(リッジ)
•ラッソ(ラッソ)
例えばsklearn介して多項式回帰(PolynomialFeatures)などの非線形回帰関数、。前処理サブモジュールコール

 

(2)リターン・アプリケーション

回帰法は、一般的に、金融や他の時系列解析の分野で使用されるいくつかの傾向を予測するためのタイミング情報を持つデータやフィット感、適している関係:
•株価トレンド予想
•トラフィックフロー予測

公開された219元の記事 ウォン称賛13 ビュー9771

おすすめ

転載: blog.csdn.net/qq_35812205/article/details/104330695