目次
機械学習アルゴリズムのツアー
この投稿では、最も一般的な機械学習アルゴリズムについて説明します。この分野の主なアルゴリズムを調べて、利用可能な方法を確認してください。この分野で遭遇する可能性のあるアルゴリズムについて考え、分類する 2 つの方法を次に示します。
-
1 つ目は、アルゴリズムの学習方法によってグループ化することです。
-
2 つ目は、形式または機能 (問題の種類) の類似性によってアルゴリズムをグループ化することです (類似した動物をグループ化するように)。
どちらのアプローチも有用ですが、類似性によってアルゴリズムをグループ化することに焦点を当て、さまざまな異なるアルゴリズム タイプを紹介します。
学習スタイルによる分類
機械学習アルゴリズムを分類または整理するこの方法は、入力データとモデル準備プロセスの役割を考慮し、最良の結果を得るために最適な問題を選択する必要があるため、便利です。機械学習アルゴリズムの 3 つの異なる学習スタイルを見てみましょう。
-
教師あり学習 教師あり学習アルゴリズムの入力データはトレーニング データと呼ばれ、スパム/スパムではない、または株価などの既知のラベルまたは結果があります。モデルは、予測を行うように求められ、それらの予測が間違っている場合に修正されるトレーニング プロセスを通じて構築されます。その後、モデルがトレーニング データで必要なレベルの精度を達成するまで、トレーニング プロセスが続行されます。分類アルゴリズムや回帰アルゴリズムなど。
2. 教師なし学習 教師なし学習アルゴリズムには、入力データにラベルがなく、既知の結果もありません。入力データに存在する構造を推測してモデルを構築します。冗長性を体系的に減らすための数学的プロセスによるものかもしれませんし、類似性によってデータを整理することかもしれません。Apriori アルゴリズムや K-Means アルゴリズムなど。
3. 半教師あり学習 半教師あり学習アルゴリズムの入力データは、ラベル付きデータとラベルなしデータの混合です。現在注目されているトピックは、ラベル付けされた例がほとんどない非常に大きなデータセットがある画像分類などの分野での、半教師あり学習方法です。
問題の種類に基づいて分類する
アルゴリズムは、多くの場合、機能 (動作方法) の類似性に基づいてグループ化されます。
回帰アルゴリズム
回帰アルゴリズム 回帰には、モデルの予測のエラーによって反復的に改善される変数間の関係をモデル化することが含まれます。回帰法は統計の主力であり、統計機械学習に組み込まれています。
最も一般的な回帰アルゴリズムは次のとおりです。
-
通常の最小二乗回帰 (OLSR)
-
線形回帰
-
ロジスティック回帰
-
段階的回帰
-
多変量適応回帰スプライン
インスタンスベースのアルゴリズム
インスタンスベースのアルゴリズム インスタンスベースの学習モデルは、モデルにとって重要または必要なトレーニング データのインスタンスまたは例を含む決定問題です。このような方法では、通常、サンプル データのデータベースを構築し、類似度を使用して新しいデータをデータベースと比較して、最適な一致を見つけて予測を行います。したがって、インスタンスベースの方法は、勝者総取り法および記憶ベースの学習としても知られています。インスタンスの表現の格納と、インスタンス間で使用される類似性測定に重点が置かれます。
最も一般的なインスタンスベースのアルゴリズムは次のとおりです。
-
K 最近隣人
-
サポート ベクター マシン (SVM)
正則化アルゴリズム
正則化アルゴリズムは別の方法 (通常は回帰法) の拡張であり、モデルの複雑さに応じてペナルティを課し、一般化にも適した単純なモデルを優先します。正則化アルゴリズムは人気があり、強力で、多くの場合、他の方法を単純に変更したものであるため、ここで取り上げます。
最も一般的な正則化アルゴリズムは次のとおりです。
-
リッジ回帰
-
なげなわが戻る
-
弾性なげなわ回帰
決定木アルゴリズム
デシジョン ツリー アルゴリズム デシジョン ツリー メソッドは、データ内の属性の実際の値に基づいて決定モデルを構築します。決定は、特定のレコードに対して予測決定が行われるまで、ツリー構造で分岐します。デシジョン ツリーは、分類および回帰の問題のデータでトレーニングされます。デシジョン ツリーは一般に高速で正確であり、機械学習で最も人気があります。
最も一般的な決定木アルゴリズムは次のとおりです。
-
分類木と回帰木 (CART)
-
反復バイナリ分類器 3 (ID3)
-
C4.5 および C5.0 (強力なメソッドの異なるバージョン)
ベイジアンアルゴリズム
ベイジアン アルゴリズム ベイジアン メソッドは、ベイズの定理を分類や回帰などの問題に明示的に適用するものです。
最も一般的なベイジアン アルゴリズムは次のとおりです。
-
単純ベイズ
-
ガウス単純ベイズ
-
多項単純ベイズ
-
単一従属推定量の平均
-
ベイジアン・ビリーフ・ネットワーク (BBN)
-
ベイジアン ネットワーク (BN)
クラスタリング アルゴリズム
クラスタリング アルゴリズム クラスタリングは、回帰と同様に、問題のクラスとメソッドのクラスを記述します。クラスタリング手法は、重心ベースの階層モデリング アプローチを使用して編成されることがよくあります。すべての方法は、データに固有の構造を使用して、データを最大の共通性を持つグループに最適に編成することに重点を置いています。
最も一般的なクラスタリング アルゴリズムは次のとおりです。
-
k平均法
-
k-中央値
-
期待値の最大化 (EM)
-
階層的クラスタリング
アソシエーション ルール学習アルゴリズム
アソシエーション ルール学習アルゴリズム アソシエーション ルール学習メソッドは、データ内の変数間に観察された関係を最もよく説明するルールを抽出します。これらのルールは、組織が活用できる大きなキューブ内の重要で商業的に有用な関連付けを検出します。
現在、最も一般的なアソシエーション ルール学習アルゴリズムは次のとおりです。
-
アプリオリ アルゴリズム アプリオリ アルゴリズム
-
Eclat アルゴリズム
人工ニューラル ネットワーク アルゴリズム
人工ニューラル ネットワーク アルゴリズム 人工ニューラル ネットワークは、生物学的ニューラル ネットワークの構造や機能に着想を得たモデルです。これらはパターン マッチングの一種で、回帰問題や分類問題でよく使用されますが、実際には、さまざまな問題タイプの数百のアルゴリズムとバリエーションで構成される巨大なサブフィールドです。ディープ ラーニングをニューラル ネットワークから分離する理由は、この分野の巨大な成長と人気のためです。ここでの焦点は、より古典的なアプローチです。
現在、最も一般的な人工ニューラル ネットワーク アルゴリズムは次のとおりです。
-
センサー
-
多層パーセプトロン (MLP)
-
誤差逆伝播法
-
確率的勾配降下法
-
ホップフィールド ネットワーク
-
放射基底関数ネットワーク
深層学習アルゴリズム
ディープ ラーニング アルゴリズムは、より大規模で複雑なニューラル ネットワークの構築に焦点を当てています. 前述のように、多くの方法は、画像やテキストなどのラベル付きアナログ データの非常に大きなデータセットに焦点を当てています. オーディオとビデオ。
現在、最も人気のある深層学習アルゴリズムは次のとおりです。
-
畳み込みニューラル ネットワーク (CNN)
-
リカレント ニューラル ネットワーク (RNN)
-
長期短期記憶ネットワーク
-
自動エンコーダー
-
ディープ ボルツマン マシン (DBM)
-
ディープ・ビリーフ・ネットワーク (DBN)
次元削減アルゴリズム
次元削減アルゴリズムは、次元削減方法がデータの固有の構造を見つけて活用するという点でクラスタリング方法に似ていますが、この場合、教師なしの方法または順序で、より少ない情報を使用してデータを要約または説明します。
これは、教師あり学習法で使用できる次元データの視覚化やデータの単純化に役立ちます。これらの方法の多くは、分類と回帰に使用できます。
-
主成分分析 (PCA)
-
主成分回帰 (PCR)
-
偏最小二乗回帰
-
多次元スケーリング (MDS)
-
線形判別分析
アンサンブル アルゴリズム
アンサンブル アルゴリズム アンサンブル アプローチは、個別にトレーニングされた複数の弱いモデルで構成されるモデルであり、その予測は何らかの方法で組み合わされて全体的な予測を行います。研究者は、どのタイプの弱学習器をどのように組み合わせる必要があるかを研究するために多くの努力を費やしてきました。これは非常に強力なテクニックであるため、非常に人気があります。
例えば
-
勾配ブースト回帰木 (GBRT)
-
ランダムフォレスト
この機械学習アルゴリズムのツアーの目的は、既存のアルゴリズムの概要と、アルゴリズムを相互に接続する方法に関するいくつかのアイデアを提供することです。
参考文献:
-
https://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/