机器学习：文本挖掘 - 代码天地

机器学习：文本挖掘

其他 2018-10-08 22:09:53 阅读次数: 0

1.数据挖掘与文本挖掘的区别（结构化数据，非结构化数据）

2.分词方案（基于字符串匹配，基于统计）

https://www.zhihu.com/question/19578687

3.中英文预处理区别

英文：https://www.cnblogs.com/pinard/p/6756534.html

中文：http://m.blog.csdn.net/lucky_ricky/article/details/78221210

4.TF-IDF缺点（缺点是有时候用词频来衡量文章中的一个词的重要性不够全面，有时候重要的词出现的可能不够多，而且这种计算无法体现位置信息，无法体现词在上下文的重要性。如果要体现词的上下文结构，那么你可能需要使用word2vec算法来支持。）

5.文本相似度计算（向量空间表示后计算余弦值）

6.如何用 word2vec 计算两个句子之间的相似度？

https://www.zhihu.com/question/29978268

7.欧氏距离和余弦相似度的区别是什么？

https://www.zhihu.com/question/19640394

在文本聚类中，一般是用欧氏距离还是余弦值？从stackoverflow这个帖子看，对于稀疏向量(文本向量显然是稀疏的)，一般用cosine比较好clustering - Euclidean distance is usually not good for sparse data?

8.朴素贝叶斯分类器和一般的贝叶斯分类器有什么区别

https://www.zhihu.com/question/20138060

9.文本降维（Hash Trick）

https://www.cnblogs.com/pinard/p/6688348.html?utm_source=itdadao&utm_medium=referral

10.主题模型（GG）

猜你喜欢

转载自blog.csdn.net/weixin_41108334/article/details/82897770

机器学习：文本挖掘

机器学习 -- 文本挖掘

Spark文本挖掘机器学习实现

使用机器学习进行文本挖掘和分析的实例

机器学习数据挖掘

数据挖掘与机器学习

【数据挖掘、机器学习】

Python的网页爬虫&文本处理&科学计&机器学习&数据挖掘工具集

概率->机器学习->文本挖掘->NLP技术路线图进阶路线规划

数据挖掘实战（6）——机器学习实现文本分类（今日头条tnews数据集）

数据挖掘和机器学习

机器学习与数据挖掘简介

[机器学习]关联挖掘介绍

Python 数据挖掘与机器学习

Python数据挖掘与机器学习

Python数据挖掘学习笔记（1）文本挖掘入门

【Python】Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

机器学习与数据挖掘学习笔记（5）关联挖掘

数据挖掘（一）如何学习“机器学习”

数据挖掘、机器学习、深度学习的区别

文本挖掘

机器学习——关联规则的挖掘问题

机器学习&数据挖掘笔记概述（转载）

机器学习和数据挖掘的联系与区别

数据挖掘（三）机器是如何学习的

.NET数据挖掘与机器学习开源框架

机器学习/数据挖掘知识整理

【Mark Schmidt课件】机器学习与数据挖掘

常用的机器学习&数据挖掘知识(点)

数据挖掘-实用机器学习技术

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)