スコアカードの開発 - Y の決定 (ヴィンテージ分析、ローリング レート分析など) が 1 つの記事で徹底的に理解されます。

スコアカードは大手銀行や企業のビジネスで活用されており、多くの先人が詳しく解説しています。この記事では、さまざまな業界のスコアカード作成における従属変数 Y の決定の違いを、決済およびクレジット スコアカード作成の観点から比較分析します。スコアカードを理解したい友達に理解を深めてもらいましょう。また、1 つのインスタンスから推論を引き出し、スコアカードをより多くの業界に適用できます。
  
ここに画像の説明を挿入
  
  

1. スコアカードとは何ですか?

  
リスク管理の分野において、スコアカードは顧客のリスクをスコアの形で測定する手段です。よく知られている Sesame Credit スコアと同様、350 から 950 ポイントの範囲で、スコアが高いほど信用度が高くなります。
  
350~550ポイントを持つユーザーは信用度が低く、Alipayの恩恵を享受することが難しい。
  
550 ~ 600 ポイントを持つユーザーは中程度のクレジットを持ち、デポジットなしでホテルに宿泊したり、Huabei サービスを開始したりするなど、いくつかの特典を享受できます。
  
600~650ポイントを保有し、信用度が高いユーザーは、前述の特典に加えて、デポジットなしで一部の旅行サービスを利用できるなど、より多くの特典を享受できます。
  
スコアが 650 ~ 700 のユーザーは信用度が高く、華北と借入の高額待遇を享受できます。
  
スコアが 700 ~ 950 のユーザーは優れた信用を持っており、一部の国からのビザを申請する際に便利です。
  
この記事では、支払いフィールドとクレジット フィールドでスコアカードを確立するときに Y を決定する方法に焦点を当てています。スコアカードの原則と Python の実装については、「スコアカードの原則と Python の実装」を参照してください。

  
  

2. スコアカード内の従属変数 Y を決定するにはどうすればよいですか?

  
スコアカード モデリングにおける Y の定義は業界ごとに異なりますが、類似点もあります。この記事では、支払いフィールドとクレジット フィールドをエントリ ポイントとして取り上げ、従属変数 Y の決定について紹介します。

  

1 支払フィールドによって従属変数 Y が決まります

  
支払いフィールドの場合、従属変数 Y の定義は比較的簡単です。たとえば、同社は 1 億の加盟店のネットワーク アクセスと取引データを保有しており、現在、どの種類の加盟店にギャンブルのリスクがあるかを評価するモデルを構築したいと考えています。従属変数 Y を定義する場合、システムの履歴閉鎖理由に「ギャンブル」という単語が含まれ、現在の販売者のステータスが 1 (不良サンプル) として閉鎖されている販売者を定義できます。
  
加盟店ステータスを閉鎖する必要があるのはなぜですか? 一部の業者の取引は賭博取引に類似しており、虚偽の監査が行われるケースも出てくるためだ。賭博行為として監査を受けた後に加盟店が重大な苦情を提出した場合、それは正常に運営されており、加盟店の事業範囲を満たしていることを証明することになります。販売者アカウントが再開され、販売者のステータスが通常に調整されます。十分な不良サンプル データがある場合、場合によっては計算の都合上、ギャンブルとして定義され、過去 2 年間に閉店した販売業者のみが不良サンプルのモデル化に使用されます。
  
不良サンプルを定義した後、0 (良好なサンプル) として定義されるものは何ですか?
  
現状が正常な加盟店を0とする方法と、現状が正常で過去に賭博行為として監査を受けていない加盟店を0とする方法の2通りがあります。一般に、正常な販売業者のデータ量は多すぎるため、モデルを構築するには、不良サンプルの数に応じて、一定の割合と時間をかけていくつかの正常なサンプルを抽出する必要があります。

  

2 信用分野の従属変数 Y の決定

  
クレジット分野の不正モデルの場合、従属変数 Y は通常、最初の返済期間 (最初の延滞) の延滞実績によって定義できます。支払いドメイン スコアカード モデルと同様、定義は比較的単純です。ただし、信用分野の信用モデルの場合、従属変数 Y の決定は比較的複雑であり、一般にローリング レート分析とヴィンテージ分析の組み合わせが必要です。
  
ロールオーバー率分析は、期限を過ぎた顧客がどの程度不良顧客として定義されるかを決定し、ヴィンテージ分析は、パフォーマンスの高い顧客をどのくらいの期間モデルに含めることができるかを決定します。従属変数 Y の決定を誰もがより明確に理解できるように、最初に使用する必要がある名詞をいくつか定義します。

  

1. 用語の定義

  
簡単にするために、一人の人物を例として使用します。ある人が2021年4月12日午前10時8分にオンラインプラットフォームで10,000元の信用ローンを借り、次の12か月以内に元金と利息の均等分割で返済するとします。いくつかの名詞をより明確に示すために、これらの名詞を次の図に入れて表示します。

ここに画像の説明を挿入

  
1. 観測時点 (obs_date):顧客の融資時点 (2021 年 4 月 12 日午前 10 時 08 分)。当社では、ローン申し込み時点までのデータを使用して、顧客の将来の延滞の可能性を予測します。
  
2. 観察期間:顧客の特性 (独立変数) を生成するために使用される時間間隔。
  
3. パフォーマンス期間:顧客が良いか悪いかを定義するために使用される期間。厳密に言えば、12 回払いの顧客は、すべてのお金が返済された後でのみ、良いか悪いかを定義できます。しかし、ヴィンテージ分析を行うことで、融資先が破綻するまでにどれくらいの時間がかかるかが分かり、残りは基本的に期日通りに返済できるため、履行期間を短縮し、新規参入できる顧客の数を増やすことができます。モデリングを増やすことができます。
  
4. パフォーマンスポイント:顧客を「良い顧客」と「悪い顧客」にどれくらいの期間で定義できるか。
  
5. Aging MOB (Month on Book):資産ローンの月。
  
MOB0:支払日から当月末まで、この例では 2021 年 4 月 12 日から 2021 年 4 月 30 日を指します。
  
MOB1:支払いの 2 か月目。この例では、2021 年 5 月 1 日から 2021 年 5 月 31 日を指します。
  
MOB2:支払いの 3 か月目。この例では、2021 年 5 月 1 日から 2021 年 5 月 31 日を指します。
  
MOB3:支払いの 4 か月目。この例では、2021 年 6 月 1 日から 2021 年 6 月 30 日を指します。
  
など、
  
MOB12:支払いの 13 か月目を指します。この例では、2022 年 3 月 31 日から 2022 年 4 月 30 日を指します。
  
製品に 12 期間がある場合、資産のライフ サイクルは 12 期間で、最大 MOB は MOB12 です。製品が 24 号の場合、最大 MOB は MOB24 です。
  
6. 延滞:顧客が毎月の返済額を返済日に全額返済しない場合、契約は延滞となります。
  
7. DPD(支払期日超過日数)の定義
  
顧客がまだ支払期日を支払っていない場合、延滞日数とは、支払期日の翌日から実際の返済日までの日数です(支払期日を含む)。実際の返却日が使用される場合、実際の返却日は統計的な日付に置き換えられます。

式: DPDN+ は延滞日数が N 日以上の顧客を意味します。たとえば、DPD60+ は延滞日数が 60 日以上の顧客を意味します。
  
例:
  
ここに画像の説明を挿入
  
顧客が最初の返済日 (2021 年 5 月 12 日) に返済できなかった場合、2021 年 5 月 13 日が 1 日延滞となり、顧客は 5 月 17 日に返済し、最初の 5 日を超えています。

その他の指示:

①延滞日数は3日/7日/15日/30日など、分析時の必要に応じて任意の延滞日数を設定可能です。

②分析における延滞日数に応じた設定は、督促方法や再現率によって異なります。
  
8.延滞期間
  
の計算方法:指定された延滞日数を延滞期間として使用します (例: 1 30 日の延滞が M1 に対応し、31 60 日の延滞が M2 に対応します)。延滞期間と延滞日数 延滞期間の数は、延滞日数によって直接計算されます (注: 教育機関によって部門が異なる場合があります)。
  
定義:返済期日の翌日から実際の返済日までの分割回数(返済日を含む) お客様が実際の返済日を指定せずに当期間内にローンを返済できなかった場合、実際の返済日は、実際の返済日と置き換えられます。統計的な日付。
  
式:
  
M0:現在期限を過ぎていない通常の資産 (C を使用して表すこともできます)。
  
M1: 1 ~ 30 日の延滞、1 期の延滞。
  
M2: 31 ~ 60 日の延滞、2 回の分割払いの延滞。
  
M3: 61 ~ 90 日の延滞、3 回の分割払いの延滞。
  
M4: 91 ~ 120 日の延滞、4 回の分割払いの延滞。
  
M5: 121 ~ 150 日の延滞、5 回の分割払いの延滞。
  
M6: 151 ~ 180 日の延滞、6 回の分割払いの延滞。
  
Mn: 30 n-29~30 n 日延滞、N 期間延滞。
  
同様に、
  
M3+: 90 日を超える延滞、3 期を超える (排他的) 延滞。
  
M4+: 120 日を超える延滞、4 期を超える (排他的) 延滞。
  
M6+:180 日を超える延滞、または 6 期間を超える延滞 (含まれない) は、不良債権とも呼ばれ、アカウントがキャンセルされます。
  
Mn+: 3*n 日を超える延滞、n 期間を超える延滞 (含まれません)。
  
9.延滞率
  
の注文数の校正:延滞率 = 延滞注文数 / 貸出注文総数 金額
  
校正:延滞率 = 残存延滞元本 / 総貸出元本。
  
  

2. ロールレート解析

  
1. 目的:リスク管理モデルでより適切に区別できるようにするには、延滞顧客を 1 (悪い顧客) として定義する期間を決定する必要があります。数日延滞している顧客の中には返済を忘れていて督促を受けて返済している人もいるでしょうから、返済意欲や返済能力がないわけではありません。パフォーマンスが遅れているすべての顧客を 1 として定義すると、モデル内の不良顧客の定義が不明確になり、モデルの区別能力に影響を及ぼします。ロールオーバー率分析では、さまざまな期間で顧客があるステータスから別のステータスに移行する状況を示すことができるため、さまざまな期限超過ステータスにある顧客の発展と変化を分析できます。
  
2. 定義:観測点 1 より前の期間 (観測期間 1) の最悪の状態から、観測点 1 以降の期間 (観測期間 2) の最悪の状態への遷移。
  

ここに画像の説明を挿入
  

3. ローリングレート分析の具体的な手順:
  
ステップ 1:観察ポイント 1 を選択し、観察ポイント 1 をカットオフタイムとして取り、観察期間 1 における顧客の最長延滞期間 (過去 6 か月など) を計算します。返済スケジュールを確認し、最も多くのボタンを押します。 悪い延滞ステータスにより、顧客は C、M1、M2、M3、M4+ などのさまざまなレベルに分けられます。
  
ステップ 2:観察ポイント 1 から開始して、観察期間 2 (次の 6 か月など) での顧客の最長延滞期間をカウントし、最悪の延滞ステータスに応じてユーザーを異なるレベル (C、M1、M2、M3 など) に分割します。 、M4+など。
  
ステップ 3:転送マトリックス内の顧客数をクロスカウントします。
  
step4:転送マトリックスの顧客数に応じて割合を計算します。
  
ステップ 5:異なる観測ポイントを選択し、ステップ 1 ~ ステップ 4 を繰り返し、スクロール速度の値を比較します。
  
例えば、観測地点を2021年6月30日の夕方12時に選択し、20,000人の顧客を観測対象とし、これらの顧客の観測期間1から観測期間2までの最大延滞ステータス変化をカウントします。 。まず、顧客の延滞ステータスに関する次の詳細なリストを計算します (ビジネス ニーズを理解するためのみであり、実際のデータではありません)。
  
ここに画像の説明を挿入
  

延滞状況詳細表によると、以下のロールオーバー率分析マトリックスが計算されます。
  
ここに画像の説明を挿入
  
ロールオーバー率分析マトリックスを観察すると、以下のことがわかります。
  
① 観察期間 1 で延滞ステータスが C (正常) の顧客の場合、95.29% が継続します。今後 6 か月間通常のステータスを維持するには、4.71% が延滞顧客に変換されます。
  
② 観察期間 1 で延滞ステータスが M1 だった顧客の場合、81.16% が将来通常のステータスに戻る、つまり歩留率は 81.86%、11.96% が M1 ステータスのまま、6.88% が今後正常なステータスに戻ります。さらに悪化する。
  
③観察期間 1 M2 ステータスで延滞している顧客の歩留まり率は 25.96%、M1 ステータスに移行する顧客は 6.41%、M2 ステータスのままが 26.12%、さらに悪化する顧客は 41.51% です。
  
④ 観察期間 1 で延滞ステータスが M3 だった顧客の場合、歩留まり率は 19.77%、M1 と M2 に換算すると 10.6%、M3 ステータスのままの顧客は 11.46%、さらに悪化する顧客は 58.17% でした。
  
⑤ 観察期間 1 で延滞ステータスが M3+ だった顧客の歩留率は 3.36% で、24.16% が M1、M2、M3 に変換され、72.48% が M3+ ステータスのままでした。
  
利回りの数によると、M3+ の延滞ステータスを持つ顧客は、ほとんど良好ではありません。リスク管理モデルでより適切な識別機能を持たせるために、悪い顧客は、M3+ の延滞ステータスを持つ顧客として定義できます (詳細90 日以上延滞している場合)。
  
実際の信用モデリングでは、事業規模や製品の発売時期などの制約により、モデリングサンプル数が少なく、不良サンプルが少なくなる場合があります。場合によっては、n 日を超えて期限切れの場合は 1 (不良サンプル)、期限切れでない場合は 0 (良好なサンプル)、n 日以内の場合はグレーのサンプル (破棄) として人為的に定義されることがあります。現在、延滞日数を測定するための基準があり、不良顧客として定義されています。顧客のパフォーマンス期間をどのくらいの期間評価に含めることができるかを決定する必要があります。
  
製品の貸出期間が 12 期間であると仮定すると、顧客が悪質な顧客であるかどうかを定義するには、12 期すべてを完了する必要がありますか? 厳密に言えば、そうです。そうしないと、その顧客は今のところ悪い顧客ではないが、今後数期間で延滞する悪い顧客になるかどうかはわかりません。また、最初の数期間で M3+ に達したアカウントもあれば、後の期間でのみ M3+ に達したアカウントもありました。したがって、十分な数の悪質な顧客をカバーできる適切なパフォーマンス期間を決定するだけで済みます。ヴィンテージ分析とは、演奏期間をどれくらいの期間に設定するのが適切かを判断することです。

  

3. ヴィンテージ分析

  
1. 目的:新規融資追加後の各MOBの延滞状況を毎月集計し、毎月の融資の延滞状況を比較し、戦略とモデルの有効性を判断し、顧客のリスク満期期間を分析する。
  
2. 表現方法: Vintage カーブの横軸は MOB、縦軸は延滞率です。延滞率は、金額ディメンションまたは注文ディメンションで計算できます。
  
3. 延滞率の計算と統計方法 (金額):
  
延滞率 = 延滞残高元本/ローン元本総額。
  
分母は融資実行月の元本総額、つまり契約金額であり、時間の経過とともに変化しません(決済や償却により減少しません)。
  
分子はBadの定義が期限を過ぎた場合の元本残高であり、BadをM3+と定義した場合、分子の計算方法は2通りあります。
  
ここに画像の説明を挿入
  
4.延滞率(注文数)の計算と統計:
  
延滞率=延滞注文数/貸出注文総数
  
分母は貸出当月の総注文数であり、時間の経過とともに変化しません(決済または償却により減額されます)。
  
分子は延滞Bad定義に達したときの注文数で、BadをM3+とすると、分子の計算方法も2通りあります。
  
ここに画像の説明を挿入
  
5. ヴィンテージテーブルの確立 ここで、
  
顧客への金利が 36%、商品期間が 12 期間、ローン 1 件あたり平均 2,000 元、月間平均ローン件数が約 10,000 件の現金ローン商品があると仮定します。返済方法は元金均等返済です。ローリングレートの分析から、期限を過ぎた Mn+ 顧客はほとんど良好ではないことがわかり、不良顧客は Mn+ 顧客として定義できます。この記事では、製品がロール レート分析に合格した後に延滞ステータスが M3+ になった顧客は、ほとんど回復されないと想定しています。2021年3月から2022年5月(現在)までのこの商品のローン実績をカウントすると、次の表が得られます。MOBの次元に従って、
  
ここに画像の説明を挿入
  
異なるローン月の順序を並べ替えると、次の表が得られます。
  
ここに画像の説明を挿入
  
MOB ディメンションのテーブルを折れ線グラフとして描画すると、次のようなビンテージ テーブルが得られます。
  

ここに画像の説明を挿入
  
ヴィンテージからわかること:
  
①横軸は顧客のライフサイクルを示しており、顧客の成熟過程の変化を反映している。
  
②縦軸は同年齢の顧客の経年変化を反映しており、月ごとのデフォルト率の変化を示しています。
  
③商品期間は12期間なので、MOB(アカウント経過期間)の最大値は12か月となり、その逆も同様です。
  
④ データ統計は Ever M3+ 延滞率なので、経年 MOB1 と MOB2 は両方とも 0 です。
  
⑤ 2021 年 3 月から 2021 年 11 月までの貸出月の延滞率は減少しており、資産の質が継続的に向上していることを示しており、リスク管理が商品のリスク次元とリスクのレベルをより包括的に理解している可能性があります。リスク管理は常に改善され、促進されます。
  
⑥異なる月に融資を行った顧客の延滞率M3+は9MOB以降安定する傾向があり、口座の満期期間が9か月であることを示しています。
  
⑦Ever M3+の延滞率を基に統計を行っているため、単月の延滞率の値は増加するだけで減少しません。ヴィンテージの表から、プレクレジット カード モデル (A カード) を構築したい場合、完全なパフォーマンス (12 回払い) が得られるローン月は 2021 年 3 月から 2021 年 6 月です。
  
完全なパフォーマンスのデータのみをモデリングに使用する場合、サンプルは融資月が 2021 年 3 月から 2021 年 5 月までの顧客からのみ採取できます。9 か月の口座満期期間のデータをモデリングに使用する場合、サンプルは 2021 年 3 月から 2021 年 8 月まで採取でき、さらに 3 か月分のサンプル データが得られます。Vintage テーブルのデータは捏造されているため、比較的鮮明に見えます。実際には、一部の融資データは、交通の流れ、外部環境、リスク管理戦略の調整などの要因により、特定の月に延滞実績が突然増加する可能性があります。

例えば、商品期間12期間、1個あたり平均5,000元の電子商取引顧客向けグループローン商品、顧客率36%の現金ローン商品がある。処理済み):
  

ここに画像の説明を挿入
  
この商品のヴィンテージ表から、2018年10月のローン延滞率が前月と比べて大幅に上昇していることがわかります。これは、交通の流れ、外部環境、リスク管理戦略の調整などの要因によるものと考えられます。

  

第 4 に、従属変数 Y の決定

  
1. 定義:従属変数 Y は、良い顧客または悪い顧客のラベル変数です。
  
2. 方法:ローリング レート分析を使用して顧客の質を定義し、ヴィンテージ分析を使用して適切なパフォーマンス期間を決定します。
  
3. 具体的な操作手順:
  
ステップ 1:ローリング レートを使用して不良顧客を定義します。たとえば、上記のケースでは、延滞率が M3+ の顧客が不良顧客であると定義されます。
  
ステップ 2:資産品質の統計指標として M3+ を使用し、ヴィンテージ データ テーブルをカウントし、ヴィンテージ カーブを描き、アカウントの満期期間を分析します。たとえば、上記のケースでは、アカウントの満期期間が 9 か月であることが確認されます。
  
ステップ 3:パフォーマンス期間が成熟期間よりも長いサンプルはモデリングに使用できますが、パフォーマンス期間が成熟期間よりも短いサンプルは Y 変数を正確に定義できないため、一時的に破棄されます。
  
4. 結論:上記ケースより、履行期間が9ヶ月を超えてM3+を延滞している顧客を1、履行期間が9ヶ月を超えて延滞していない顧客を0、その他の顧客は破棄される。
  
これまでに、支払いフィールドとクレジット フィールドの従属変数 Y の決定が分析されました。必要としているより多くの友達と写真を共有することを歓迎します。
  
参考文献

http://t.zoukankan.com/zjfjava-p-14213026.html
https://blog.csdn.net/eroswang/article/details/117735703
https://vip.kingdee.com/article/243694728837810944?productLineId=1
https://baijiahao.baidu.com/s?id=1703345218390615519&wfr=spider&for=pc

あなたは興味があるかもしれません:
Python でピカチュウを描くPython で
ワード クラウド マップを描く
Python で 520 回の永遠の鼓動を描くPython 顔認識 -だけが
私の目にはneo4j を操作するには Python の py2neo ライブラリを使用しますPython のロマンチックな告白ソース コード コレクション (愛、バラ、写真の壁、星空の下での告白) の関係マップを構築します。



長押し (スキャン) して上の QR コードを認識すると、Python とモデリングの知識をさらに学ぶことができ、勉強や仕事がより楽しくなります。

おすすめ

転載: blog.csdn.net/qq_32532663/article/details/125461299