本人CSDN博客专栏：https://blog.csdn.net/yty_7

Github地址：https://github.com/yot777/

Hello 大家好，感谢大家关注杨桃在CSDN博客上的专栏。

通过Python基础教程和进阶讲座之后，相信您一定对Python这门编程语言有了大致的了解，也通过一些例子有了感性认识。

本人的教程和讲座只是一个提纲挈领，Python还有很多细节地方没有面面俱到，请大家发扬自己动手丰衣足食的精神，不懂就百度一下、CSDN一下嘛！

好了，言归正传，我们开始新一个篇章——机器学习。

什么是“学”、“习”

请注意，我的标题是“学”、“习”，不是学习。为什么呢？因为在中国古汉语，“学”、“习”是两个完全不同的词，到了近代，“学”、“习”才成了一个词“学习”。

那么“学”、“习”各自是什么意思呢？圣人孔子《论语》的一句话，就是最好的解答。

孔子曰：“学而时习之，不亦说乎？”（这句话如果你没学过，自己面壁半小时）

译文：孔子说：“学到知识后按时温习并实践练习，不是一件令人心生喜悦的事吗？”

圣人就是圣人，把“学”、“习”的事就这么简明扼要的说清楚了：三个关键点：学到知识、按时温习、实践练习。

回忆一下，你在上学的时候，是不是也就是这么过来的？

学到知识：老师在课堂上讲一元二次方程的求解方法，推导出公式：

按时温习：在课后照着书本理解公式的含义

通过多次温习将公式记忆在脑海中。如果记忆得不对，反复回忆推导过程。

实践练习：在考试中将记忆在脑海中的公式应用在实践计算中。如果这时候记忆得不对，就会影响考试成绩，代价就有点大。

我们对自己的“学”、“习”过程是很清楚的，那么机器呢？完全类似！

学到知识：通过大量训练数据进行数学建模，让机器“学”到数据的某种规律。

按时温习：通过已经建好的模型来运行测试数据（测试数据的量一般是训练数据的20%~30%），验证“学”到的那些规律是否正确。如果正确，进入实践环境。如果不正确，返回第一步让机器继续“学”。注意：正确一般不是指100%完全的正确率，是有一个阈值，根据应用场景的不同有99%、95%、90%等不同正确率。一旦达到这个阈值，就表明达到效果可以运用到实践中。

实践练习：将机器“学”到数据的模型应用到实际场景下来解决问题，比如分类、预测、聚类等。如果在实践环节出现了达不到正确率阈值的情况，应该视为程序缺陷，需要对第一步进行重新训练并建模。

为什么要用机器来进行学习

解释这个问题之前，我们对比一下人类学习和机器学习存在哪些显著差异：

（1）由于原始数据的多样性和复杂性，人类在认知新事物的速度远不如机器，很多数学建模人工是根本不可能完成的。

（2）由于人的主观状态起伏很大，在身体、精神、情绪等因素的影响下，人不能够在任何情况下都记得住已经验证好的模型，例如一元二次方程的求根公式

在状态不好的临场考试很有可能忘记。机器则不同，在任何情况下，只要你需要，它都能准确的使用已经验证好的模型。

（3）机器没有主观色彩，全是程序化的输入输出，可以做到真正的“铁面无私”。人类始终无法做到这一点，就像很多体育比赛的裁判员打分，总有一部分“印象分”，这其实是有可操作的空间你懂的。

机器学习也不是万能的。要记住，机器可以代替一部分人类的思考，但永远代替不了人类的情感。理智+情感才是完整的人类。但我们必须提前要有危机意思，谨防出现《终结者》那样的人类悲剧，必须给机器加上牢固的枷锁，让它只能在人类的控制之下为人类服务。

总结

“学习”是孔圣人的“学而时习之”的意思，三个关键点：学到知识、按时温习、实践练习。

机器和人的学习步骤是完全类似的，同样三个关键词：训练数据、测试数据、实际场景。

机器学习相比人类有显著优势，但必须对机器加上牢固的枷锁，让它只能在人类的控制之下为人类服务。

本人CSDN博客专栏：https://blog.csdn.net/yty_7

Github地址：https://github.com/yot777/

如果您觉得本篇本章对您有所帮助，欢迎关注、评论、点赞！Github欢迎您的Follow、Star！

yot777

发布了55 篇原创文章 · 获赞 16 · 访问量 6111

私信关注

杨桃的Python机器学习1——引言：什么是“学”、“习”，为什么要用机器来学习

什么是“学”、“习”

为什么要用机器来进行学习

总结

猜你喜欢