NLP自然语言处理知识结构索引汇总

python自然语言处理实战
python和nltk电子书
自然语言处理简介第一章实例代码
NLTK文本整理和清洗示例代码
 
NLTK 对文本结构进行语法分析代码示例
NLTK获取文章摘要代码示例
NLTK朴素贝叶斯,文本分类代码示例 采样 SMSSpamCollection数据集下载
混淆矩阵(Confusion matrix)的原理及使用(scikit-learn 和 tensorflow)
gensim安装 文本主题模型代码示例
Scrapy网络爬虫安装与测试
简单的网络scrapy爬虫示例代码
NumPy一些基础数值计算
Scipy示例代码
pandas数据处理示例代码
matplotlib 的数据可视化示例代码
在Hadoop上运行NLTK代码示例
NLTK使用Hive UDF
NLTK 标记文本和WordNet的基础代码示例
NLTK替换和矫正单词代码示例
NLTK分布式进程和大型数据集的处理 execnet教程
pip install python-dateutil 使用dateutil解析日期和时间
使用lxml从HTML中提取URL 安装lxml
使用dateutil解析日期和时间,LXML提取URL代码示例
NLTK 字符串文本预处理全部代码示例
NLTK词性标注和组快代码示例
 
 
中文 python自然语言处理实战核心技术与算法 中文处理 涂铭
源代码
jieba分词和高频词提取示例代码
jieba中文词性表注和CRF命名实体识别代码示例
gensim的安装
gensim进行LSI LSA LDA主题模型,TFIDF关键词提取,jieba TextRank关键词提取代码实现示例
stanfordnlp parser进行PCFC 句法分析代码示例
wiki中文文本语料下载,训练Word2vec and doc2vec 文本向量化代码示例
 
hadoop 权威指南总结
为什么不用大量硬盘的数据库来进行大规模数据分析?
使用Hadoop来分析数据,map和reduce.jave MapReduce
 
 
Hive编程指南
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

猜你喜欢

转载自blog.csdn.net/qq_29678299/article/details/90440750