关于机器学习的一些感想

版权声明:"Night Mode pro" with Chrome/"Night Reader for Firefox"/Firefox is a good pleasure https://blog.csdn.net/appleyuchi/article/details/85526064

1.各种竞赛啥问题?
首先各种竞赛是公司里面没有合理方案下的一个产物,
用尽可能少的成本来获取最优方案.
但是冠军方案一定是最优方案吗?
显然不是,
因为各种比赛切断了"人与人沟通"的因素,
显然对业务的理解程度更有利于你的建模,
而所谓的数据比赛禁止了这种可能性.

另外,特征应该是数据建模人员来决定,而不是比赛举办方来决定给多少,这个也削弱了合理建模的可能性.

2.决策树类的算法有啥问题?
诸如:
XGBOOST,GBDT,catboost,lightGBM,随机森林,C4.5,C5.0,ID3
所有的决策树类的算法都默认这样一个假设,即:
各类特征,对标签y的贡献的是线性组合关系.
显然实际业务中,特征和特征之间可能需要组成一个新的非线性特征.

猜你喜欢

转载自blog.csdn.net/appleyuchi/article/details/85526064