Kaggle学习(一)产品和搜索词语相关性自动评价

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/DanielDingshengli/article/details/86507722

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

测试集输入到模型中输出评价和实际评价相比较
在这里插入图片描述
评分标准:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
原先是2被评价成1的有100个,被评价成2的有200个
为什么这么设置:
在这里插入图片描述
提交几百万次————
限制提交次数
最好的情况
在这里插入图片描述
冠军思路
在这里插入图片描述
去掉html标签,拼写错误的单词/同义词替换掉,Stemming(统计词的原型,比如动词和形容词统一成名词,复数统一成单数)

**组合提升:**弱分类器——强分类器
在这里插入图片描述
无免费午餐定理在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
模型是已经做好了的
http://www.cnblogs.com/zongfa/p/9304353.html
X0和X1的区别:X0分错的会在X1里面重点关照
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/DanielDingshengli/article/details/86507722