笔记-文本分类

文本分类是NLP领域最基本的应用场景,现实生活中很多问题都能划归为文本分类问题,诸如垃圾邮件分类、有害评论检测、新闻主题分类等。学术界里文本分类也是研究热点,从最初的模式识别方法到机器学习方法,再到近年来的深度学习方法,各类新型的算法都会尝试在文本分类上验证效果。而文本分类问题的普遍性也使得其成为了人工智能落地的一个重要案例。学习文本分类相关问题的解决方案,能在屏蔽NLP底层基础技术(诸如分词、词性标注、句法分析…通常也是难点)的前提下,在算法层面开展相关工作。

在这一块,自己也投入了比较大的时间精力,通过文本分类问题的解决流程,熟悉了NLP高阶应用处理的一般流程。通过实现一些经典的模型,锻炼了码力。总结学习过程中的参考链接如下。

新闻上的文本分类:机器学习大乱斗

用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践

brightmart/text_classification: all kinds of text classificaiton models and more with deep learning

CNN在NLP领域的实践(1) 文本分类

【长篇干货】深度学习在文本分类中的应用

通过kaggle比赛学习机器学习文本分类方法

中文文本挖掘预处理流程总结

知乎“看山杯” 夺冠记

猜你喜欢

转载自blog.csdn.net/bitcs_zt/article/details/80856024