NLP相关学习资料

一、综合

https://github.com/fighting41love/funNLP
NLP民工的乐园: 几乎最全的中文NLP资源库

https://github.com/huggingface/blog
里面的内容非常值得认真学习。

二、文本自动收集

https://github.com/cjymz886/find-Chinese-medical-words
从网上抓取的医疗语料中,以一种改进的无监督方法寻找语料库存在的词;主要方法利用互信息熵,正向最大匹配,搜索引擎进行迭代来找词;语料库不限领域,本实验是以医疗领域的文本。

https://github.com/flyyang/medical-news
用于爬取相关医疗新闻网站,目前支持以下几个网站:
中国数字医疗网、亿欧、新浪医药、健康中国、动脉网、新华健康、生物探索(biodiscovery)。

三、语料库

https://github.com/GanjinZero/awesome_Chinese_medical_NLP
中文医学NLP公开资源整理:术语集/语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/etc

https://github.com/scienceasdf/medical-books
一些医学书籍

https://github.com/UCSD-AI4H/Medical-Dialogue-System
The MedDialog dataset (Chinese) contains conversations (in Chinese) between doctors and patients. It has 1.1 million dialogues and 4 milli

おすすめ

転載: blog.csdn.net/dragon_T1985/article/details/119104322
おすすめ