自然语言处理——文本分类

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/baiziyuandyufei/article/details/82716054

文本分类是自然语言处理中的一个重要应用。也是学习了机器学习各种模型后,最好的一个实际运用。之前也写了一些文章,但是都是断断续续,从来没有写成系列。这两年的工作,总算是有机会轮到我做一些应用NLP技术的工作。最近喜欢上边开发边写ppt,伴随着梳理资料,回忆以前的工作,想着写一写总结。我不是数学专业,数学也不好,而且从来不愿意推公式。近几年看书感觉不再云里雾里,应该是该写的书都被写出来了,所以大家都开始写公式背后的原理。这个系列打算用我自己的理解,自己的话来写。其实自己比较喜欢写写像散文一样的文字,吼吼,终于过了研究生毕业,不用再用所谓的书面文字写东西了。打算分两篇写。上篇写用人话说清原理。下篇介绍高级库的用法。

基础篇

  1. 什么是数据线性可分?
  2. 怎么将二分类模型应用到多分类问题?
  3. 怎么评价训练出的分类模型?
  4. 朴素贝叶斯分类器就是数数。
  5. 支持向量机是怎么画分类平面的?
  6. 把浅层神经网络应用到文本分类的包是fastText。

应用篇

  1. 简化版的LibSVM之LibLinear
  2. 工业级朴素贝叶斯工具
  3. 脸书的高效杰出工具fastText
  4. 贝叶斯与SVM的结晶nbsvm

猜你喜欢

转载自blog.csdn.net/baiziyuandyufei/article/details/82716054