杨桃的Python机器学习1——引言:什么是“学”、“习”,为什么要用机器来学习

本人CSDN博客专栏:https://blog.csdn.net/yty_7

Github地址:https://github.com/yot777/

Hello 大家好,感谢大家关注杨桃在CSDN博客上的专栏。

通过Python基础教程和进阶讲座之后,相信您一定对Python这门编程语言有了大致的了解,也通过一些例子有了感性认识。

本人的教程和讲座只是一个提纲挈领,Python还有很多细节地方没有面面俱到,请大家发扬自己动手丰衣足食的精神,不懂就百度一下、CSDN一下嘛!

好了,言归正传,我们开始新一个篇章——机器学习。

什么是“学”、“习”

请注意,我的标题是“学”、“习”,不是学习。为什么呢?因为在中国古汉语,“学”、“习”是两个完全不同的词,到了近代,“学”、“习”才成了一个词“学习”。

那么“学”、“习”各自是什么意思呢?圣人孔子《论语》的一句话,就是最好的解答。

孔子曰:“学而时习之,不亦说乎?”(这句话如果你没学过,自己面壁半小时)

译文:孔子说:“学到知识后按时温习并实践练习,不是一件令人心生喜悦的事吗?”

圣人就是圣人,把“学”、“习”的事就这么简明扼要的说清楚了:三个关键点:学到知识按时温习实践练习

回忆一下,你在上学的时候,是不是也就是这么过来的?

学到知识:老师在课堂上讲一元二次方程的求解方法,推导出公式:

按时温习:在课后照着书本理解公式的含义

通过多次温习将公式记忆在脑海中。如果记忆得不对,反复回忆推导过程。

实践练习:在考试中将记忆在脑海中的公式应用在实践计算中。如果这时候记忆得不对,就会影响考试成绩,代价就有点大。

我们对自己的“学”、“习”过程是很清楚的,那么机器呢?完全类似!

学到知识:通过大量训练数据进行数学建模,让机器“学”到数据的某种规律。

按时温习:通过已经建好的模型运行测试数据(测试数据的量一般是训练数据的20%~30%),验证“学”到的那些规律是否正确。如果正确,进入实践环境。如果不正确,返回第一步让机器继续“学”。注意:正确一般不是指100%完全的正确率,是有一个阈值,根据应用场景的不同有99%、95%、90%等不同正确率。一旦达到这个阈值,就表明达到效果可以运用到实践中。

实践练习:将机器“学”到数据的模型应用到实际场景下来解决问题,比如分类、预测、聚类等。如果在实践环节出现了达不到正确率阈值的情况,应该视为程序缺陷,需要对第一步进行重新训练并建模。

为什么要用机器来进行学习

解释这个问题之前,我们对比一下人类学习和机器学习存在哪些显著差异:

(1)由于原始数据的多样性和复杂性,人类在认知新事物的速度远不如机器,很多数学建模人工是根本不可能完成的。

(2)由于人的主观状态起伏很大,在身体、精神、情绪等因素的影响下,人不能够在任何情况下都记得住已经验证好的模型,例如一元二次方程的求根公式

在状态不好的临场考试很有可能忘记。机器则不同,在任何情况下,只要你需要,它都能准确的使用已经验证好的模型。

(3)机器没有主观色彩,全是程序化的输入输出,可以做到真正的“铁面无私”。人类始终无法做到这一点,就像很多体育比赛的裁判员打分,总有一部分“印象分”,这其实是有可操作的空间你懂的。

机器学习也不是万能的。要记住,机器可以代替一部分人类的思考,但永远代替不了人类的情感。理智+情感才是完整的人类。但我们必须提前要有危机意思,谨防出现《终结者》那样的人类悲剧,必须给机器加上牢固的枷锁,让它只能在人类的控制之下为人类服务。

总结

“学习”是孔圣人的“学而时习之”的意思,三个关键点:学到知识按时温习实践练习

机器和人的学习步骤是完全类似的,同样三个关键词:训练数据测试数据实际场景

机器学习相比人类有显著优势,但必须对机器加上牢固的枷锁,让它只能在人类的控制之下为人类服务。

本人CSDN博客专栏:https://blog.csdn.net/yty_7

Github地址:https://github.com/yot777/

如果您觉得本篇本章对您有所帮助,欢迎关注、评论、点赞!Github欢迎您的Follow、Star!

发布了55 篇原创文章 · 获赞 16 · 访问量 6111

猜你喜欢

转载自blog.csdn.net/yty_7/article/details/104881290