文本表示与文本特征提取的区别 - 代码天地

文本表示与文本特征提取的区别

企业开发 2023-04-09 17:42:54 阅读次数: 0

文本表示与文本特征提取的区别

文本表示的作用就是将文本的非结构化的信息转化为结构化的信息，例如独热编码：

猫：［1，0，0，0］
狗：［0，1，0，0］
牛：［0，0，1，0］
羊：［0，0，0，1］

词袋模型：

句子1：我/有/一个/苹果
句子2：我/明天/去/一个/地方
句子3：你/到/一个/地方
句子4：我/有/我/最爱的/你

句子 1 特征: ( 1 , 1 , 1 , 1 , 0 , 0 , 0 , 0 , 0 , 0 )
句子 2 特征: ( 1 , 0 , 1 , 0 , 1 , 1 , 1 , 0 , 0 , 0 )
句子 3 特征: ( 0 , 0 , 1 , 0 , 0 , 0 , 1 , 1 , 1 , 0 )
句子 4 特征: ( 2 , 1 , 0 , 0 , 0 , 0 , 0 , 1 , 0 , 1 )

而文本特征提取，在文本信息中选出最能表示文本含义的部分。例如TF-IDF的权值计算，很明显权值高的词具有更高的意义。

很多时候二者合并进行了，比如TF-IDF其实先用一个词袋模型进行了文本表示，然后直接进行权值计算即特征提取。

猜你喜欢

转载自blog.csdn.net/a1097304791/article/details/122196812

文本表示与文本特征提取的区别

文本特征提取

文本特征提取实践

文本特征提取方法

基于神经网络的文本特征提取——从词汇特征表示到文本向量

文本特征：特征提取（一）

特征提取—文本，字典特征提取

文本特征提取方法研究

文本特征提取和向量化

基于sklearn的文本特征提取与分类

文本分类的特征提取算法

文本特征抽取TfidfVectorizer(特征工程之特征提取)

特征工程-特征提取：字典特征提取、文本特征提取、jieba分词处理、Tf-idf文本特征提取

文本特征提取CountVectorizer（特征工程之特征提取）

文本型数据特征化（特征提取）

字典特征提取和文本特征抽取

python#特征工程和文本特征提取

【机器学习】特征工程 - 文本特征提取TfidfVectorizer

【机器学习】特征工程 - 文本特征提取CountVectorizer

机器学习之路：python 文本特征提取 CountVectorizer, TfidfVectorizer

python学习文本特征提取(一) DictVectorizer

Scikit-learn：Feature extraction文本特征提取

文本特征提取算法-TF-IDF

【NLP自然语言处理】文本特征提取

字典特征提取、文本特征提取、jieba分词处理、tf-idf文本特征提取概念及代码实现

sklearn文本特征提取与“达观杯”文本智能处理挑战赛

机器学习-2.特征工程和文本特征提取

人工智能_1_初识_机器学习介绍_特征工程和文本特征提取

机器学习（机器学习介绍、特征工程和文本特征提取）

特征选择（区别于特征提取）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)