共同住宅ローンの製品のモデリング結果の枝(未完)

サブモデル評価

1.iv直接2ルールより値の大きいなど。これは、カバレッジ、不正な顧客の割合を見てください。ストレート拒否ルールの60%以上の悪い顧客の割合。各間隔、サンプルの累積割合は、累積デフォルト率を見てください。ヒット率が成立する(サンプルの割合)が低い場合は、高い精度(典型的には60%破壊サンプル)制御におけるルールとして風にそれを置きます。

2.他の周波数ビン、悲哀計算値、IVの値は、2よりIV欠失値より大きいが0.01未満です。(多くのビニングがあります)。並べ替え災いや価値観、災い単調。

80%の欠損値よりも3変数大きいが削除されました。

一つのモデルを持っていた、そのルール(IV値ルール)を有していました。

p値が有意であるか、または、相関を削除4.ロジスティック回帰、VIF値。

0.44

0.79

合併後の分割20のアリコート、最終スコアパケット。

最終モデルLR 6つの変数。

ユーザーの不良債権率の承認率、悪い顧客のリコール、:ビジネスリスク判断の指標。

6.ローンが監視しました。毎週ビュー前3ヶ月の安定性は、毎月の背中を行うことができます。監視KS。変数のKSのPSIと監視。休憩の後、しきい値が更新されます。延滞監視。試運転の終了を報告します。

7.クレジットラインスルーレート、信用リスク率。

 

 

 

問題:

テストセットとトレーニングセットの分布の1モデルのスコアは同じですか?同センター?どのくらいの間状の隙間?どうやって?なぜ?

2.なぜyと延滞30日かかりますか?どのような理論?

3.情報のチェックサムのブラックリストには、どのように多くのヒットを拒否しましたか?これらのサンプルのモデリングの背景にも、まだ中に入れて?

4.データをモデリングデータはアポロのですか?そして、要約ビニングは、アポロのデータに対して実行しましたか?

5.サンプルこの、どのように不均一なデータ処理?

6.ノークロスタイム検証。

7.ノーユーザアプリケーション時間。なぜか?この情報はそれに非常に敏感ですか?

8.適用時間、延滞時間を貸します。

9.変数ビニングピース、同じ周波数ビンを持つすべての?あなたにビジネスセンスは、この部門の各セクションがありますか?なぜ、yとビニングとの間の関係を考慮していませんか?カイ二乗ボックスのような?

10.消費スコアの計算ロジックレベル?それが安定しているかどうか?

 

 

ビッグデータ単位:

データ、変数処理。

22個の変数が始まり、11はLR再び重要な変数は有意な5つの変数が最終モデルに、最後の6つの変数を削除し、IVの後に削除されません。

 

不正防止戦略分析:

詐欺率、悪い顧客率。

 

 

情報技術部門:モデルの開発チーム、モデル展開チーム。

(本社およびドッキングシステム、モデルのパラメータ変更、などを含む)システムの改革。

 

1.ドッキング外部データ。

2.モデルの展開、情報科学技術省は、個人の口座を開設します。

おすすめ

転載: www.cnblogs.com/ironan-liu/p/11826791.html