【NLP】互信息 - 代码天地

【NLP】互信息

其他 2019-04-18 03:26:50 阅读次数: 0

【任务4 -文本表示】

TF-IDF原理。
文本矩阵化，使用词袋模型，以TF-IDF特征值为权重。（可以使用Python中TfidfTransformer库）
互信息的原理。
使用第二步生成的特征矩阵，利用互信息进行特征筛选。

互信息

互信息是衡量两个随机变量的相关性，也就是一个随机变量中包含的关于另一个随机变量的信息量，所谓的随机变量，即随机试验结果的量的表示，可以简单理解为按照一个概率分布进行取值的变量，比如随机抽查的一个人的身高就是一个随机变量。可以看出，互信息其实就是对X和Y的所有可能的取值情况的点互信息PMI的加权和。
在这里插入图片描述

from sklearn import metrics as mr
mr.mutual_info_score(label,x)

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html

在这里插入图片描述

参考资料
文本挖掘预处理之TF-IDF：文本挖掘预处理之TF-IDF - 刘建平Pinard - 博客园 (https://www.cnblogs.com/pinard/p/6693230.html)
使用不同的方法计算TF-IDF值：使用不同的方法计算TF-IDF值 - 简书(https://www.jianshu.com/p/f3b92124cd2b)
sklearn-点互信息和互信息：sklearn：点互信息和互信息 - 专注计算机体系结构 - CSDN博客 (https://blog.csdn.net/u013710265/article/details/72848755)
如何进行特征选择（理论篇）机器学习你会遇到的“坑”：如何进行特征选择（理论篇）机器学习你会遇到的“坑” (https://baijiahao.baidu.com/s?id=1604074325918456186&wfr=spider&for=pc)

猜你喜欢

转载自blog.csdn.net/weixin_42317507/article/details/89290102

【NLP】互信息

互信息、条件互信息

互信息

互信息--从思维的角度看互信息---研究

R语言互信息和条件互信息

相对熵与互信息

NLP之【点互信息PMI】——衡量两变量之间的相关性

信息熵、自信息与互信息

浅谈信息增益与互信息的联系

信息论与互信息

机器学习_互信息的理解

对互信息量的理解

互信息（Mutual Information）的介绍

模式识别之互信息

02 交互信息量

熵、相对熵、互信息

KL散度&互信息

机器学习丨什么是互信息

文本特征选择-互信息

【DA】特征选择之互信息

计算互信息的bins如何取？

条件熵，互信息的推导

【数学基础】互信息(Mutual Information)

平均互信息与条件熵

信息熵、条件熵、联合熵、互信息和条件互信息

信息熵、信息增益、条件熵、互信息

信息熵，条件熵，互信息的通俗理解

条件自信息跟互信息区别简述

信息论学习模型 ----互信息

信息论模型——熵、互信息

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)