文献阅读--一种面向文本分类的特征迁移方法

     本文提出了一种基于迁移量的迁移学习解决方法,对从训练集中构造出的模型进行修正,减少训练集与测试集模型中存在的差异,最终提高文本的分类精度。最后在中文垃圾邮件过滤、中文网页分类和英文网页分类中对提出的方法进行验证。文本分类中的迁移学习问题还有很大的研究空间,例如部分词语所含的信息量会随着时间的发展而变化。这样在文本分类中,不仅仅是特征词的特征分布发生变化,而且组成特征空间的特征词典需要不断地更新。

猜你喜欢

转载自www.cnblogs.com/lxt-/p/11958973.html