风控模型demo - 代码天地

风控模型demo

其他 2019-08-27 19:38:02 阅读次数: 0

#拉格朗日插值法
from scipy.interpolate import lagrange
def Lagrange(df,col):
def polyinterp_column(s,n,k=5):
#取该缺失值的前后五个值作为参数
y = s[list(range(n-k,n))+list(range(n+1,n+1+k))]
y = y[y.notnull()] #去除空值
return lagrange(y.index,list(y))(n)
#逐个判断是否需要插值
for i in range(len(df)):
if (df[i].isnull())[i]:
df[col][i] = polyinterp_column(df[col],i)
return df[col]
#数值型类型特征的方差分析法去除特征
import numpy as np
import pandas as pd
def Variance(df,col):
arr = np.array(df[col])
#这里取方差小于1的删除
if arr.var()<1:
del df[col]
return df
from sklearn.cluster import KMeans
def KmeansAbnormal(df,k,spec):
"""
:param df: 传入的数据
:param k: 聚类中心个数
:param sep: 阈值
:return: 返回去除异常值后的数据
"""
data = df.copy()
# 将数据进行标准化
data = 1.0 * (data - data.mean()) / data.median()
# 建立聚类模型
km = KMeans(n_clusters=k, max_iter=200)
km.fit_transform(data)
# 添加类别列
data["center"] = [np.array(km.cluster_centers_[i]) for i in km.labels_]
#计算每个样本到对应聚类中心距离
norm_lis = []
for i in range(data.shape[0]):
norm = np.array(data.loc[i][data.columns[:-1]]) - data.loc[i]["center"]
norm = np.linalg.norm(norm)
norm_lis.append(norm)
data["distance"] = norm_lis
data["categorical"] = km.labels_
#计算每个聚类中心的平均距离
avergae_distance = []
for i in range(k):
avergae_distance.append(data["distance"][data["categorical"] == i].mean())
# 计算每个样本点到中心的距离与该中心平均距离的比值
data["spec"] = [data.iloc[i]["distance"] / avergae_distance[data.iloc[i]["categorical"]] for i in range(data.shape[0])]
#保留小于阈值的数据
df = df[data["spec"] < spec]
return df

猜你喜欢

转载自www.cnblogs.com/daguonice/p/11420240.html

风控模型demo

风控模型评估

风控模型指标详解

信贷风控模型开发----模型简介

风控模型之模型分组

风控模型评价指标总结

风控评分模型开发流程

风控模型调优相关知识

风控模型部署相关知识

《风控策略笔记》之评分模型

风控需要精确模型吗？

风控模型指标PSI详细理解

风控模型师面试准备--业务+模型篇

风控业务数据处理流程-数据采集、反欺诈、风控模型、催收

构建风控评分卡模型介绍（WOE/KS/ROC)

金融评分卡风控模型及其特征工程

风控模型岗面试问题总结

【风控建模】XGBoost算法构建信用评分卡模型

【风控建模】信用评分卡模型简介

互联网金融风控模型大全

机器学习实战--风控评分卡模型

风控建模之模型训练（基于逻辑回归）

风控评分模型全流程的开发及应用

《利用Swap Set分析风控模型更替的影响》

【采用】互联网金融风控模型的设计

Datawhale 金融风控-贷款违约预测:模型融合

Nebula 在 Akulaku 智能风控的实践：图模型的训练与部署

Python实现的拍拍贷金融风控模型

行为序列模型在抖音风控中的应用

广告流量反作弊风控中的模型应用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)