基于“预训练词向量模型“和“深度学习“的情感分类(keras) 电影评论数据的中文情感分析 - 代码天地

基于“预训练词向量模型“和“深度学习“的情感分类(keras) 电影评论数据的中文情感分析

其他 2021-01-31 10:17:32 阅读次数: 0

某大学：基于电影评论数据的中文情感分析。

基于电影评论数据的中文情感分析

1. Data Preparation

1).数据集
使用电影评论数据作为训练数据集. 其中, 训练数据集20000条(正负向各10000条); 测试数据集6000条(正负向各3000条)

2).数据预处理
1.去除停用词, 并使用jieba进行分词
2.使用预训练的词向量模型，对句子进行向量化

2. 各种实现方法准确率对比

Algorithm	Accuracy(avg)	Accuracy(fasttext)	Accuracy(matrix)	说明
Naive-Bayes	73.72%	74.32%	69.34%(拼接和补齐)	/
Decision-Tree	65.27%	66.84%	55.34%(拼接和补齐)	/
KNN	76.69%({‘n_neighbors’: 19})

猜你喜欢

转载自blog.csdn.net/weixin_54707168/article/details/113248463

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)