自然语言处理相关数据集和语料

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huanghaocs/article/details/77921810

说明

这里给出了常用的自然语言处理任务的数据集以及一些语料库的链接下载,分中英文两个方面。大部分是电商评论类的数据。

英文数据集

Web data: Amazon reviews

https://snap.stanford.edu/data/web-Amazon.html
http://jmcauley.ucsd.edu/data/amazon/

Restaurant Reviews Dataset

http://www.cs.cmu.edu/~mehrbod/RR/

Movie Review Data

http://www.cs.cornell.edu/people/pabo/movie-review-data/

中文数据集

Amazon.cn Dataset:https://sites.google.com/site/homecxu/dataset
自然语言处理与信息检索共享平台:http://www.nlpir.org/?action-category-catid-28
电商评论:http://yongfeng.me/dataset/

GitHub Chinese Dataset

https://github.com/Lab41/sunny-side-up/wiki/Chinese-Datasets

其他海量数据集

http://rensanning.iteye.com/blog/1601663

猜你喜欢

转载自blog.csdn.net/huanghaocs/article/details/77921810
今日推荐