Pyspark+tensorflow-クレジットローンデータ分析実践(2) - ビジネス理解

2. ビジネスの理解

どのような指標 (変数) に基づいて、顧客がローンを滞納するかどうかを予測しますか?
ここに画像の説明を挿入

  • 顧客のデフォルト モデルを確立するには、デフォルト状態 Y に対する変数 X の影響を決定し、それを予測に使用する必要があります。属性、状態、動作に基づいて変数を構築するのは非常に非効率です。

  • たとえ何千もの変数と特定のアルゴリズムを使用してモデルが構築されたとしても、このモデルには価値がありません

  • したがって、契約違反のビジネス状況を分析するには、次のようにします。
    ここに画像の説明を挿入

  • 契約違反による収益: 10,000を借り、殺害して返済を拒否し、10,000を獲得

  • 契約違反の費用: 返済がない場合は費用が発生します (信用、信用、評判など)。

  • デフォルトのブレークポイント: 交差点

信用格付けはデフォルト収入を考慮する必要はありませんが、信用格付けを行う人ごとにデフォルトコストが異なるため、重要なのはデフォルトコストを反映する指標を見つけることです

  • 承認前:融資を受けた後、収入が費用よりも高く、返済意欲が不十分であり、ローンが滞納する可能性があります。

    • 返済意欲が不十分な原因は次のとおりです。 故意に返済しない
  • 融資後:経済状況が悪化すると返済能力が不足し、デフォルトに陥る可能性があります。

    • 返済能力が不十分になる原因は、 1. 能力よりも欲望が大きい 2. 安定した仕事がない 3. 不安定な生活環境
  • 上記の理由はデータ テーブルには絶対に保存されないため、テーブルに存在するいくつかの変数によって反映される必要があります。

例えば:

  • 資産残高は返済能力が不足しているかどうかを反映します

  • 国際収支は、願望が能力よりも大きいかどうかを反映します

  • 資産残高のボラティリティ、平均資産残高、資産残高の変動係数は、生活環境が安定しているかどうかを反映します
    ここに画像の説明を挿入
    データが必要な場合は、QQ1240929749、備考: csdn データを追加してください

おすすめ

転載: blog.csdn.net/weixin_43676010/article/details/103778612