实习点滴(6)--关于机器学习的一些有用的东西

        这本是一篇论文,我在借鉴这篇论文的同时,加上自己在机器学习方面的一些感悟,总结一番。

1.机器学习的过程。

        包括“将问题表示出来”,“寻找到评价问题的损失函数”,“进行优化过程”。

2.泛化真的很重要。

        我们都知道,每一个好模型训练出来,不只是让它在我们的测试集上,原则上是想让它在任何我们需要的场景下都有好的指标,所以判断一个模型的好坏,泛化能力也是一个重要的指标。

3.仅仅有数据是不够的。

        当我们把经验运用到机器学习中,会减少很多工作量,就会让机器不再盲目的去做一件事,会提高机器学习的效率

4.直觉不适合用于高维空间。

        这句话如何理解呢?我们都是从拟合一条直线来理解机器学习的(至少我是这样子的),当特征空间比较小的时候,我们还会在大脑中想想出它大概是个什么东西,比如是一条线呢,还是一个平面呢,但是高维特征空间,我们的大脑就无法形象的显示出来(牛人除外),这时候的一些直觉可能会误导我们模型的训练。
5.特征工程很关键。
        除了神经网络之外的机器学习,非常倚重特征,就好比我之前用的CRF或者SVM等,一个好的特征工程很可能直接影响这个模型的好坏,正是由于其重要性,直接衍生出来这个工程。所以这是一个重要的环节。

6.更多的数据胜过好的模型算法。

        现在是大数据时代,更多的数据会让这个模型更加鲁棒和泛化能力更强,也许一个模型无法优化,但是更多的数据能让模型学习到更多的规律,从而提高性能。

7.我们要训练多个模型,而不止一个。

        现在模型种类千千万,我们不能说只用一个模型,现阶段,优秀的模型更多的是模型之间的搭配,比如,我即将要学习的BiLstm+CRF,就是一个很好的例子,将这些模型进行正确的搭配,会很大程度上提高性能,正所谓“尺有所短,寸有所长”。

猜你喜欢

转载自blog.csdn.net/sihailongwang/article/details/76129603