NLP任务数据集汇总

一、机器翻译:

1、WMT系列:http://www.statmt.org

二、文本分类:

1、中文:

2、英文:

三、中文分词:

1、词典:

(1)搜狗实验室发布的互联网词库(SogouW,15w词条)www.sogou.com/labs/resource/w.php

(2)清华大学开放中文词库(THUOCL)thuocl.thunlp.org

(3)HanLP发布的词库(千万级)www.hankcs.coom/nlp/corpus

发布了78 篇原创文章 · 获赞 4 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/wangxiaosu/article/details/104187805
今日推荐