机器学习日常练习——红楼梦作者分析(聚类)

实验要求

实验题目:《红楼梦》作者分析

《红楼梦》是我国著名的四大名著之一,一般的认为《红楼梦》的前八十回为曹雪芹撰写,后四十回为高鹗续写,但也有学者对此并不认可。能否利用聚类分析的方法来对《红楼梦》的作者进行分析。
提示思路:一般来说,不同的作者往往会具有不同的写作风格,这些风格可以通过在文中的虚词的频率进行衡量,因此,可以考虑统计各章中虚词出现频率,并以此作为基础数据来聚类分析,对《红楼梦》章节进行划分,从而分析章节与作者之间的关系。

实验目的

在掌握聚类算法基础原理基础上,掌握应用聚类算法解决实际问题。

实验内容<

猜你喜欢

转载自blog.csdn.net/qq_50675813/article/details/121885920