サブモデル評価
1.iv直接2ルールより値の大きいなど。これは、カバレッジ、不正な顧客の割合を見てください。ストレート拒否ルールの60%以上の悪い顧客の割合。各間隔、サンプルの累積割合は、累積デフォルト率を見てください。ヒット率が成立する(サンプルの割合)が低い場合は、高い精度(典型的には60%破壊サンプル)制御におけるルールとして風にそれを置きます。
2.他の周波数ビン、悲哀計算値、IVの値は、2よりIV欠失値より大きいが0.01未満です。(多くのビニングがあります)。並べ替え災いや価値観、災い単調。
80%の欠損値よりも3変数大きいが削除されました。
一つのモデルを持っていた、そのルール(IV値ルール)を有していました。
p値が有意であるか、または、相関を削除4.ロジスティック回帰、VIF値。
0.44
0.79
合併後の分割20のアリコート、最終スコアパケット。
最終モデルLR 6つの変数。
ユーザーの不良債権率の承認率、悪い顧客のリコール、:ビジネスリスク判断の指標。
6.ローンが監視しました。毎週ビュー前3ヶ月の安定性は、毎月の背中を行うことができます。監視KS。変数のKSのPSIと監視。休憩の後、しきい値が更新されます。延滞監視。試運転の終了を報告します。
7.クレジットラインスルーレート、信用リスク率。
問題:
テストセットとトレーニングセットの分布の1モデルのスコアは同じですか?同センター?どのくらいの間状の隙間?どうやって?なぜ?
2.なぜyと延滞30日かかりますか?どのような理論?
3.情報のチェックサムのブラックリストには、どのように多くのヒットを拒否しましたか?これらのサンプルのモデリングの背景にも、まだ中に入れて?
4.データをモデリングデータはアポロのですか?そして、要約ビニングは、アポロのデータに対して実行しましたか?
5.サンプルこの、どのように不均一なデータ処理?
6.ノークロスタイム検証。
7.ノーユーザアプリケーション時間。なぜか?この情報はそれに非常に敏感ですか?
8.適用時間、延滞時間を貸します。
9.変数ビニングピース、同じ周波数ビンを持つすべての?あなたにビジネスセンスは、この部門の各セクションがありますか?なぜ、yとビニングとの間の関係を考慮していませんか?カイ二乗ボックスのような?
10.消費スコアの計算ロジックレベル?それが安定しているかどうか?
ビッグデータ単位:
データ、変数処理。
22個の変数が始まり、11はLR再び重要な変数は有意な5つの変数が最終モデルに、最後の6つの変数を削除し、IVの後に削除されません。
不正防止戦略分析:
詐欺率、悪い顧客率。
情報技術部門:モデルの開発チーム、モデル展開チーム。
(本社およびドッキングシステム、モデルのパラメータ変更、などを含む)システムの改革。
1.ドッキング外部データ。
2.モデルの展開、情報科学技術省は、個人の口座を開設します。