特征选择(2):mRMR特征选择算法(matlab代码实现)

其他 2018-11-06 05:54:19 阅读次数: 0

mRMR是什么

是基于最大相关最小冗余的特征选择方法。

要点：1.相关是特征列与类标的相关性，也可以值特征之间的相关性，通常来说，特征与类标相关性越高，说明这个特征越重要。则选择这个特征，这就是最大相关。

2.最小冗余：特征选择的目的就是减少分类器的负担，减少不需要的特征。而两个特征之间如果相关性很高，这表示这两个特征对分类有着相同的作业。也可以说是冗余度比较高，这去掉其中一个特征。

相关性度量方法

相关性度量一般有三种：互信息（MI），皮尔森相关系数，最大信息系数

本文算法用的是互信息。

mRMR具体实现

function [fea, score] = mRMR(X_train, Y_train, K)
bdisp=0;
nd = size(X_train,2);
nc = size(X_train,1);
t1=cputime;
for i=1:nd, 
   t(i) = mutualinfo(X_train(:,i), Y_train);
end; 
[tmp, idxs]=sort(-t);
fea_base = idxs(1:K);

fea(1) = idxs(1);

KMAX = min(1000,nd); %500

idxleft = idxs(2:KMAX);

k=1;
% if bdisp==1,
% % fprintf('k=1 cost_time=(N/A) cur_fea=%X_train #left_cand=%X_train\n', ...
% %       fea(k), length(idxleft));
% end;

for k=2:K,
   t1=cputime;
   ncand = length(idxleft);
   curlastfea = length(fea);
   for i=1:ncand,
      t_mi(i) = mutualinfo(X_train(:,idxleft(i)), Y_train); 
      mi_array(idxleft(i),curlastfea) = getmultimi(X_train(:,fea(curlastfea)), X_train(:,idxleft(i)));
      c_mi(i) = mean(mi_array(idxleft(i), :)); 
   end;

   [score(k), fea(k)] = max(t_mi(1:ncand) - c_mi(1:ncand));

   tmpidx = fea(k); fea(k) = idxleft(tmpidx); idxleft(tmpidx) = [];
   
%    if bdisp==1,
% %    fprintf('k=%X_train cost_time=%5.4f cur_fea=%X_train #left_cand=%X_train\n', ...
%       k, cputime-t1, fea(k), length(idxleft));
%    end;
end;

return;

%===================================== 
function c = getmultimi(da, dt) 
for i=1:size(da,2), 
   c(i) = mutualinfo(da(:,i), dt);;
end;

代码中互信息的测量函数为文中的mutualinfo

具体代码下载地址：https://github.com/zhan81776075/feature-selection

猜你喜欢

转载自blog.csdn.net/m0_37628529/article/details/83312225

特征选择(2):mRMR特征选择算法(matlab代码实现)

特征选择mRMR算法代码实现及安装下载

mRMR特征选择算法（feature_selection）的使用

最大相关 - 最小冗余（mRMR）特征选择

利用BPSO与KNN进行特征选择及matlab代码实现

基于互信息的特征选择算法MATLAB实现

基于鲸鱼算法的二维特征选择方法及其Matlab代码实现

最小冗余 - 最大相关性（mRMR）特征选择

特征选择（含代码）

特征选择算法-Relief

特征选择常用算法

特征选择思想与算法

特征选择算法学习2

特征选择——Matrix Projection算法研究与实现

特征选择(1):特征相关性度量之互信息量(matlab代码实现)

2. 特征工程之特征选择

【机器学习】特征选择之最小冗余最大相关性(mRMR)与随机森林(RF)

特征选择

特征的选择

特征工程-特征选择

特征工程的特征选择

【特征工程】特征选择

降维和特征选择的关键方法介绍及MATLAB实现

特征选择_过滤特征选择

特征选择 8、特征选择

特征选择常用算法综述

常用的特征选择算法介绍

算法选择--数据与特征工程

特征选择算法--Relief与ReliefK

特征选择 | 递归特征消除算法筛选最优特征

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)