参数与超参数

作为机器学习攻城狮（咳咳：调参员），参数和超参数是最最基础的常识。

1、参数（模型可以根据数据可以自动学习出的变量）

参数指的是模型内部的配置变量(configuration variable)，可通过数据来估计其取值。

从数据中估计或学习得到

通常不被人为设定

常作为最终模型的一部分被保存

参数是机器学习算法的关键，它们是从历史训练数据中学习到的，属于模型的一部分。

在经典的机器学习文献中，我们可以把模型看作是假设，把参数看作是针对某特定数据实现假设的工具，通常来说，模型参数是算法考虑所有可能取值后得到的最优解。

统计学：在统计学中，我们可能会为一个变量假设服从某个分布，如高斯分布。高斯分布具有两个参数，分别是均数和标准差。这样的理解在机器学习中也是成立的，这些参数可以通过数据进行估计，并且作为预测模型的一部分。

编程：在编程中，我们可能把参数传递给函数。在这个情况下，参数作为函数变量(function argument)可以取一系列值中的一个。在机器学习中，我们使用模型就是在外部数据中进行预测所需的函数和参数。

模型具有固定个数的参数，叫做参数模型，若具有可变个数的参数，则为非参数模型。

扫描二维码关注公众号，回复： 2746210 查看本文章

下面是几个关于模型参数的例子：

人工神经网络的权重

支持向量机中的支持向量

线性回归及logistic回归中的回归系数

2、超参数（用来确定模型的一些参数）

模型超参数指的是模型外部的配置变量，不能通过数据来估计其取值

常用于帮助估计模型参数的过程

通常由人为设定

可用探索的方法对其进行设定

可针对给定的预测建模问题对超参数进行调整

我们不能获得针对某个特定问题的模型参数的最优取值。但我们可以采用经验法则，参考用于其他问题的取值，或者通过反复尝试寻找最佳值。

当机器学习算法用于解决特定问题时，我们正是采用规则搜寻或者随机搜寻的方式，对模型的超参数进行调整，来发现模型的参数，从而得到最优的预测。

下面是几个关于模型超参数的例子：

训练神经网络的学习率(learning rate)

支持向量机中的C(惩罚系数)和sigma(与支持向量的个数有关)

k最近邻算法(k-nearest neighbors)中的k(邻居个数)