1つの最尤推定
全体集合分布F(X、θは)、X1、一般的なサンプルについてサンプリングX2、... XnのX1、X2、X3、...、ある関節密度関数:
ここで、θを固定が、未知パラメータとみなされ、X1、X2、... Xnのが固定され、L(X -は、θが)、θの関数である、尤度関数、パラメータ[シータ]の値を見つける尤度関数であると呼ばれますそれが最大値をとり、最尤推定法が呼び出されます。
2最尤推定法
典型的には、対数尤度関数は、対数尤度関数を導出、よどみ点を得るために方程式の解により、回転させることができる場合、対数尤度関数を得ることができます。
3つのフェアオッズ
n個のイベントの確率たN1、N2、N3、...、NNの観点から1 / N1、2 / N 2、3 / N3 ...、1つのNNオッズは、/処理したに近いその後ディーラー戻り0対応するオッズは、公正オッズと呼ばれます。実生活では、ディーラーは、一般的に乗じた公正オッズよりも少なくなります彼らの収入を保証し、係数0α。
5特徴選択
次元削減:PCA主成分分析
L寸法は:変数の高次の項を追加します。
6オーバーフィッティング
あまりフィット感とは対照的に、トレーニングとテストセットにトレーニングデータを、実際にモデルが良いトレーニング効果を設定しますが、テスト・セットではあまり効果的であれば、それは、あまりにもフィット起こりました。
7ワンホットエンコーディング
実際のデータ処理は、状況に直面することは分析のために数値データに非数値データを変換し、いくつかの変数は、主値の存在を反映し、そして価値のは意味がない、そのような特徴は、に分割されている三種類、簡単な数値不適切な代替手段を使用して、この時間は、使用することができるワンホット符号化処理を。
一般的に言えば、昔ながらの回帰分析、SVMは何をする必要があるワンホットエンコーディング変換をではなく、決定木とランダムフォレスト。
8リターン
連続従属変数:リターン
離散従属変数:分類
9つの仮説
性的な意味合い:常識を説明するためには、正しいです
シンプル:ちょうど、多くの場合、我々はいくつかの簡略化を行う必要があり、現実的な仮定
発散:結論に押し下げられ、いくつかの単純化の仮定では、必ずしも仮定が有効な結論が唯一の確立された場合にのみ
10件の定期的なアイテム
役割:オーバーフィット防止するために、
定期的な入力モード:
正規のL1:絶対値を追加します。
L2正則:二乗項を追加します
両方の組み合わせ:定期的な特徴選択機能を持つL1が、n個のL2は、多くの場合、より優れた性能であります
11のデータ使用
トレーニングデータ:係数トレーニング
検証データ:スケジュール
テストデータ:テスト結果
勾配降下12
BGD:バッチ勾配降下
SGD:確率的勾配降下法
ミニバッチSGD:確率的勾配降下法の少量、といくつかのより実用的な