クロスバリデーションのポイント

クロスバリデーションの1効果

クロス検証方法は、性能評価モデルを予測するために使用できるモデルパラメータのモデル化と検証です。操作の方法は、トレーニングおよび試験セットにデータをサンプリングすることで、トレーニングセットは、モデル、テストセットを評価するために使用されるモデルを訓練するために使用されます。

少量のサンプルデータ(貧弱未満の点)、クロスバリデーションは、モデルを訓練するために使用することができる場合に、最良のモデルを選択します。

2.単純なクロスバリデーション

単純なクロスバリデーションは、トレーニングおよび試験セットにランダムサンプルデータをスケーリングし、次にモデルと学習モデルパラメータを検証することです。サンプルデータ中のこのような操作を複数回、それぞれ得られたトレーニングセットとテストセットは異なり、損失関数を評価し、最適なモデルパラメータを選択することによってように訓練されたモデルパラメータは、同じではありません。

3。Kの交差検定

K倍クロスバリデーションをランダムKサブサンプルデータに分割し、次にランダムにモデルをトレーニングするトレーニングセットとしてデータの(K-1)の部分のいずれかを選択し、最後にテストセットのようです。サンプルデータ(K-1)部品のKアウト部、Kの可能な組み合わせが存在するが、機能の損失を評価し、最適なモデルパラメータを選択することによって、その後回操作とをkに等しい未満であってもよいです。

4.クロスバリデーションを残します

サンプルデータがMである場合に、クロスバリデーション脱退K倍クロスバリデーションは、ケース特殊なケースでありK=m、すなわち、検証は、サンプルデータセットです。状況は非常に少ないデータでない場合は明らかに、それは検証サンプルセットとして1を維持するだけでなく、このメソッドは、主にサンプルデータは非常にまれなケースのために使用されています。この方法は一つだけのデータが元のデータ分布に近いトレーニングデータを最大化するために、研修に参加していないです。

方法を選択5.

それを知ることができ、上記の3つのクロスバリデーションの操作から、のみ粗いモデル場合、単純なクロスバリデーションは、通常の状況下でK倍クロスバリデーションであることができ、残して小さなクロスバリデーションは、サンプルデータの場合で明らかです。

サンプルデータが十分である場合、サンプルは、検証セット、テストセットとして、ランダムデータ、トレーニングセットの3つのセットに分割することができます。モデルを訓練するために使用されるトレーニングセットは、検証モデルの一般化の能力を評価するために使用され、それによってテストセットの最適モデルパラメータを選択する、予測モデルの品質を評価するために設定され、最終的に最適なモデルパラメータは、選択されました最も適切なモデルとパラメータ。

おすすめ

転載: www.cnblogs.com/Ooman/p/11350130.html