机器学习中的基础知识(一)

版权声明:系CDA数据分析师原创作品,转载需授权 https://blog.csdn.net/yoggieCDA/article/details/87720282

(1)准确率的概念,准确率就是分类模型预测准确的比例。

(2)AUC(曲线下面积)则是一种考虑到所有可能的分类阈值的评估标准。ROC 曲线下面积代表分类器随机预测真正类要比假正类概率大的确信度。

(3)激活函数就是一种函数,也就是将前一层所有神经元激活值的加权和输入到一个非线性函数中,然后向下一层传递该函数的输出值。

(4)AdaGrad是一种复杂的梯度下降算法,重新调节每个参数的梯度,高效地给每个参数一个单独的学习率。这些知识都是需要我们要了解的。

(5)在机器学习中,反向传播神经网络中完成梯度下降的重要算法。首先,在前向传播的过程中计算每个节点的输出值。然后,在反向传播的过程中计算与每个参数对应的误差的偏导数。

(6)基线就是被用为对比模型表现参考点的简单模型。基线帮助模型开发者量化模型在特定问题上的预期表现。

(7)批量就是指模型训练中一个迭代使用的样本集。批量大小就是一个批量中样本的数量。批量大小通常在训练与推理的过程中确定。

(8)偏置就是与原点的截距或偏移量。偏置被称为机器学习模型中的 b 或者 w0。而二元分类器一类分类任务,输出两个互斥(不相交)类别中的一个。binning/bucketing则是根据值的范围将一个连续特征转换成多个称为 buckets 或者 bins二元特征,称为 buckets或者bins。

(9)检查点则是在特定的时刻标记模型的变量的状态的数据。检查点允许输出模型的权重,也允许通过多个阶段训练模型。检查点还允许跳过错误继续进行。注意其自身的图式并不包含于检查点内。

在这篇文章中我们给大家介绍了机器学习涉及到的知识以及概念,这些知识都是我们需要了解的知识。由于篇幅原因我们就给大家介绍到这里了,希望这篇文章能够帮助大家更好的了解机器学习。我们下期见。

猜你喜欢

转载自blog.csdn.net/yoggieCDA/article/details/87720282