特征选择方法汇总

其他 2021-02-27 00:17:36 阅读次数: 0

卢总 - 特征选择方法汇总

特征选择三种方法：

Filter(过滤法)
Wrapper(包装法)
Embedded(嵌入法)

过滤法

卡方检验

直接看sklearn代码：

首先做OHE

Y = LabelBinarizer().fit_transform(y)

做完之后 $Y$ 的shape是 $N\times K$

observed = safe_sparse_dot(Y.T, X)          # n_classes * n_features

$K,N\times N,M$

形成一个 $K\times M$ 的矩阵，表示每个类别对应的特征之和

observed
Out[6]: 
array([[250.3, 171.4,  73.1,  12.3],
       [296.8, 138.5, 213. ,  66.3],
       [329.4, 148.7, 277.6, 101.3]])

在这里插入图片描述

最后算卡方的代码：

def _chisquare(f_obs, f_exp):
    """Fast replacement for scipy.stats.chisquare.

    Version from https://github.com/scipy/scipy/pull/2525 with additional
    optimizations.
    """
    f_obs = np.asarray(f_obs, dtype=np.float64)

    k = len(f_obs)
    # Reuse f_obs for chi-squared statistics
    chisq = f_obs
    chisq -= f_exp
    chisq **= 2
    with np.errstate(invalid="ignore"):
        chisq /= f_exp
    chisq = chisq.sum(axis=0)
    return chisq, special.chdtrc(k - 1, chisq)

自变量对因变量的相关性
在这里插入图片描述
$A$ 是观测， $E$ 是期望，其shape都是 $K\times M$

自变量有 $N$ 种取值，因变量有 $M$ 种取值，考虑自变量等于 $i$ 且因变量等于 $j$ 的样本频数的观察值与期望的差距，构建统计量

KL散度、相对熵

MIC

Fisher

猜你喜欢

转载自blog.csdn.net/TQCAI666/article/details/114105417

特征选择方法汇总

【python】数据挖掘分析清洗——特征选择（特征筛选）方法汇总

特征选择方法

常用的特征选择方法

特征选择的方法

特征选择/筛选方法

特征点匹配+特征检测方法汇总

【python】数据挖掘分析清洗——特征选择筛选(降维)方法汇总

理解特征工程及特征选择的方法

特征选择常用方法整理

sklearn特征选择方法及参数

机器学习特征选择方法

【机器学习】特征选择方法

4.特征选择方法：

常用特征选择方法及 Sklearn特征选择包说明

特征检测和特征匹配方法汇总

【无标题】特征点匹配+特征检测方法汇总

机器学习中的特征——特征选择的方法以及注意点

特征工程概述及特征选择常用方法的小整理

机器学习之特征选择方法

机器学习中特征选择的方法综述

特征选择方法之信息增益【转】

（十一）特征选择方法之信息增益

机器学习特征选择方法总结

文本分类-特征选择方法

［每日问答］特征选择有哪些方法？

【转】几种常用的特征选择方法

机器学习之特征选择方法整理

常见特征选择方法简要笔记

REF特征选择方法的原理+用法+误区

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)