Python自然语言处理-学习笔记(6) ——— 文本分类

分类器学习

规律总结:
1.以n、ch结尾的倾向于男性
2.以yn、h结尾的倾向于女性

from nltk import *
函数名称 解释
gender_feature = {feature_name:feature_value}
tarin_set = [({feature_name:feature_value},tag)]
classifier = NaiveBayesClassifier.train(train_set)
classifier.classify()
classifier.show_most_informative_features(n)
朴素贝叶斯分类器
(首先构建一个特征提取器gender_feature)

分类
展示前n个对分类最有效的特征
from nltk.classify import *
函数名称 解释
accuracy(classifier,test_set)
评估分类准确率
apply_features(gender_feature,train_set) 返回一个类似于List但不会在内存中存储所有特征集的对象

猜你喜欢

转载自blog.csdn.net/qq_37717661/article/details/81349801