使用python中的pymrmr模块来进行特征提取，深入学习mRMR（最大相关最小冗余准则） - 代码天地

使用python中的pymrmr模块来进行特征提取，深入学习mRMR（最大相关最小冗余准则）

企业开发 2023-09-30 21:12:40 阅读次数: 0

文章目录

系列文章目录
前言
一、最大相关最小冗余准则（mRMR）在python对应的库？
二、如何安装和使用prmrmr？
- 1.新建一个环境
- 2.安装pymrmr库
- 3.如何使用pymrmr？
- pymrmr实验结果
总结

前言

最大相关最小冗余准则(maximal relevance andminimal redundancy，mRMR)，其核心思想是从给
定的特征集合中寻找与目标类别有最大相关性且相互之间具有最少冗余性的特征子集。

一、最大相关最小冗余准则（mRMR）在python对应的库？

对应的库是pymrmr，具体详细链接请参考Github mRMR代码

二、如何安装和使用prmrmr?

1. 新建一个环境

随便起一个名字，例如我起名为pymrmr，后面最好输入3.6版本。

conda create -n pymrmr python=3.6

2. 安装pymrmr库

先安装numpy，Cython，再安装pymrmr。

推荐使用清华镜像 -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install numpy
pip install Cython
pip install pymrmr

3. 如何使用pymrmr？

具体请看代码

import pandas as pd
import pymrmr

# 读入数据
data = pd.read_excel("080220.xlsx")

#选取十个特征
mr=pymrmr.mRMR(data,'MIQ',10)
print(mr)

其中mRMR中一共三个参数，每个参数的具体含义如下：

参数一：DataFrame，要求第一列是目标量（标注），其他列是特征量，其中首行必须是特征名称，且必须是字符形式，例如a1,a2，等
参数二：选择的方法，有'MID'、'MIQ'两种。MID是基于互信息的mRMR，MIQ是基于商的mRMR。
参数三：要求int类型，最后输出的特征数量。

4.pymrmr实验结果

*** MaxRel features ***
Order 	 Fea 	 Name 	 Score
1 	 10 	 a10 	 4.420
2 	 83 	 a83 	 3.124
3 	 76 	 a76 	 2.971
4 	 75 	 a75 	 2.946
5 	 80 	 a80 	 2.944
6 	 78 	 a78 	 2.928
7 	 81 	 a81 	 2.789
8 	 82 	 a82 	 2.329
9 	 38 	 a38 	 2.291
10 	 44 	 a44 	 2.280

这样我们就选出了我们的十个特征，特征之间不会存在冗余。

总结

以上就是今天要讲的内容，本文仅仅简单介绍了在python中pymrmr的使用。这样我们就可以很快的处理冗余数据了。

猜你喜欢

转载自blog.csdn.net/qlkaicx/article/details/127884395

使用python中的pymrmr模块来进行特征提取，深入学习mRMR（最大相关最小冗余准则）

最大相关 - 最小冗余（mRMR）特征选择

最小冗余 - 最大相关性（mRMR）特征选择

【机器学习】特征选择之最小冗余最大相关性(mRMR)与随机森林(RF)

使用PyTorch执行特征提取和微调的迁移学习来进行图像分类

python干货：如何使用Python对音频进行特征提取？

python 使用tsfresh进行时间序列特征提取

DeepSort中特征提取模块理解

使用LSH 进行特征提取

python学习之特征提取

最大相关，最小冗余

机器学习中的特征提取

使用caffe的python接口进行特征提取和人脸验证，修改代码dis=1-dis 使用caffe的python接口进行特征提取和人脸验证

python：使用Scikit-image对单波段遥感影像进行形状特征提取（morphology）

GEE python：使用熵核函数进行纹理特征提取和gracy灰度值计算

python：使用Scikit-image对遥感影像进行角点检测特征提取（corner）

Keras中如何使用预训练的模型进行特征提取或微调--以图片分类为例

python图像特征提取

python—sift特征提取

机器学习 - 特征提取

机器学习---特征提取

【机器学习】特征提取

机器学习之路：python 文本特征提取 CountVectorizer, TfidfVectorizer

机器学习之路：python 字典特征提取器 DictVectorizer

python学习文本特征提取(一) DictVectorizer

音频特征提取——python/ librosa工具包使用

librosa包进行mfcc特征提取

CountVectorizer方法对中文进行特征提取

python：使用Scikit-image库进行单波段遥感图像颜色直方图特征提取（histogram）

Python 利用特征提取或者特征选择进行降维

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)