クレジットスコアカード(WOEおよびIVの値)_Supplement

顧客のライフサイクル:検討段階、購入段階、購入後の行動段階など、顧客がさまざまな製品またはサービスを受け取ったときに受ける段階を説明するために使用されます
ここに画像の説明を挿入

顧客生涯価値:将来の顧客ライフサイクル全体で顧客が生成する合計値。CLVは顧客関係のレベルを測定する指標として使用できます。

ここに画像の説明を挿入
顧客情報:顧客分析に使用されます。顧客分析の目的は、戦略を策定するための正確な視点を見つけ、顧客を最適に獲得して維持し、高価値の顧客を定義することです

  • 説明情報:性別、年齢、地理的な場所、収入など、顧客の基本的な属性情報
  • 行動情報:顧客の行動情報、つまり、購入、登録、閲覧、さまざまなデバイスの使用など、顧客が製品やサービスを使用するときの一般的なパターン。
  • インタラクティブな情報:ウェブサイトまたはソフトウェアの実際のパフォーマンステストに使用される顧客とウェブサイトのインタラクティブな情報(最も重要なことはコンバージョン率です)
  • 態度情報:好み、選択、欲求、ブランドの認知と感情などの顧客の好みの情報

ficoスコアの分類基準は、一般的な個人における各分類の重要度に基づいています。特定のグループ(クレジットカードを使い始めたばかりの人など)では、各分類の重要度が異なる場合があります

クレジットスコアカードプロセス(マイニング)
生データ->サブセットの抽出->データの読み取り->ウォッシュデータ

クレジットスコアカードYは1または0でなければなりません

ここに画像の説明を挿入
WOE(エビデンスの重み):エビデンスの重みは、ボックスが予測に対して持つエビデンスの量を表します。値が大きいほど、ボックスを1に予測するエビデンスが強くなり、値が小さいほど、ボックスが0に予測されるエビデンスが強くなります。これが0の場合、このボックスには証拠がないことを意味します。これは、主にビニング時のボックスの分類効果を決定するために使用されます
ここに画像の説明を挿入
。WOEの場合、外れ値を処理する価値があります。たとえば、WOEが無限大に見える場合、0.5をWOE式に追加して作成できます。非無限値

ここに画像の説明を挿入
WOEグラフはWOE値を介して描画することもできます。このから、単一のXとYの関係がわかり、XからYへの変化傾向を反映できます。

ここに画像の説明を挿入
カテゴリ変数をビニングによって連続変数に変換し、ビニング後にWOE値を計算して新しいWOE列を取得します。このWOE列はビニング後の各ボックスの測定値であるため、連続変数と見なすことができますYが0/1である識別の程度について、最後にWOE値の列をロジスティック回帰にフィードします;
(重要)クレジットスコアカードの最後のロジスティック回帰に配置された各列は、WOE値の列です

ここに画像の説明を挿入
IV値:各ボックスの情報値。ここでの情報はその予測能力です。
注:ここでの情報は、前の決定木での情報とは異なります。決定木での情報は、情報の混乱の程度を示します。ここでの情報は、その予測能力です。値が大きいほどボックスの予測能力が強くなり、この列のすべてのIV値の合計は変数の合計予測能力を示します。したがって、IV値が大きいほど、情報をより予測しやすくなります強いほど、変数はより重要になります

ここに画像の説明を挿入
ここに画像の説明を挿入
IV <0.02、ほとんど予測の助けがない、0.02 <= IV <0.1、ある程度の助けがある
0.1 <= IV <0.3、予測に大きな助けがある、IV> = 0.3、大きな助けがある
IV> 0.5、慎重に扱う必要がある、それは良すぎるかもしれません、IV> 1、変数は必要ありません

IV> 0.5のときに変数を使用できるかどうかを確認するにはどうすればよいですか?
チェック方法は、新しいデータを使用して該当するかどうかを検出することです。また、通常の状況では、欠損値が多数ある場合、IV> 0.5も表示されることがあります。
したがって、IV値のランキングは、可変重要度ランキングとしても使用できます

補足:IV値に加えて、ランダムフォレストは変数の重要度ランキングも計算できます

概要:WOE値はロジスティック回帰に使用され、IV値は変数の重要度のランキングを計算して変数をフィルタリングするために使用されます

ここに画像の説明を挿入
オッズ:P(良い)/ P(悪い)1人/カテゴリの
(オッズ)で:同じカテゴリの人々の割合、良いと悪いの
WOE の比率:すべての人々へのこのカテゴリの貢献の割合

オッズ= P(良い)/ P(悪い)


オッズ比とスコアは比例関係にありますIn(odds)= -In(P /(1-P))
ここに画像の説明を挿入
ここに画像の説明を挿入

元の記事69件を公開 賞賛された11件 20,000回以上の閲覧

おすすめ

転載: blog.csdn.net/weixin_41636030/article/details/90269621