python数据挖掘入门与实践---作者归属问题 - 代码天地

python数据挖掘入门与实践---作者归属问题

其他 2019-10-25 13:28:31 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/ypgsh/article/details/79692318

问题：通过对文本中的信息分析，找到文章对应的作者

用到的算法模型：SVM，支持向量机。

SVM可以简单看着一种二类分类器（画一条线，使两边类别的点到线的距离最大化），扩展后可以是多类分类器，但实际也是A类和非A类的二类分类，只是进行多次，将A B C D....类分别分出来。

解决问题两种思路：

1、功能词。

功能词(如the,which,that...)是指本身含义很少，但却是组成句子必不可少的成分。一般认为功能词的使用通常不是由文档的内容决定而是有作者的习惯决定。因此通过统计文档的功能词分布可以关联到作者的归属信息。

sklearn相关模块：slearn.svm用来通过功能词分布分类作者

2、字符N元语法。

与单词N元语法相对应，字符N元语法以单个字符为单位（N通常2~6）

思路和上面功能词一样，通过统计字符N元语法然后通过其分布和SVN分类相应的作者

猜你喜欢

转载自blog.csdn.net/ypgsh/article/details/79692318

python数据挖掘入门与实践---作者归属问题

python数据挖掘入门与实践（二）

python数据挖掘入门与实践（一）

9.作者归属问题

【python】《Python数据挖掘入门与实践》实验环境搭建

python经典书籍--python数据挖掘入门与实践

Python数据挖掘入门与实践：带你入门数据挖掘技术，应用实际项目

《Python数据挖掘入门与实践》pdf 附下载链接

Python数据挖掘入门与实践-Apriori算法勘误

Python数据挖掘入门与实践-OneR分类算法

Python数据挖掘入门与实践--亲和性分析

《python数据挖掘》和《python数据挖掘入门与实践》两本书读后感

python数据挖掘入门与实践---用图挖掘找到感兴趣的人

《python数据挖掘入门与实践》决策树预测nba数据集

python数据挖掘入门与实践--------转换器（数据与处理）与流水线

数据挖掘与python实践 |（一）引言

数据挖掘与python实践 |（一）引言

python数据挖掘与机器学习实践技术

Python数据挖掘入门与实践--用转换器抽取特征

Python数据挖掘入门与实践---用决策树预测获胜球队

Python数据挖掘入门与实践---使用scikit-learn 估计器分类

《Python数据挖掘入门与实践》高清中文版+高清英文版+源代码

分享《Python数据挖掘入门与实践》高清中文版+高清英文版+源代码

python数据挖掘入门与实践----------特征值，主成分分析

python数据挖掘入门与实践-----------通过亲和力分析推荐电影（Apriori）

「数据挖掘入门系列」Python快速入门

数据挖掘入门必看的几个问题

Python数据挖掘学习笔记（1）文本挖掘入门

计划与实践（数据挖掘）

《Python数据挖掘入门与实践》高清中文版PDF+高清英文版PDF+源代码

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)