机器学习从入门到创业手记-2.1监督学习算法

 

       战情室第一天

 

       杨导师空手走进了办公室,说今天上午不需要电脑,咱们玩个游戏顺便我也了解一下你们到底有多差?我介绍一下规则,我来出题,你们每个人按顺序回答,如果你答不出来或者答错了,就罚去买一瓶饮料,等游戏结束了,中午就是买对应数量饮料放在战情室里供大家饮用。听明白了么?

 

       “明白了”,我们齐声答到。

 

       “回答问题时,我还有两个要求,一不能背概念和公式,二你回答的问题其他两个人也要能听明白为标准,我会根据你的答案去问其他两个人是否能听懂,他们若是不懂会有连坐机制,回答者和不懂者两个人各罚一瓶饮料”,杨导师说道,“回答问题顺序按照安逸,路思,高维开始,第一题按机器学习算法讲,我们现在在战情室的学习方式属于哪类,为什么?”

      

       我:“属于监督学习,因为您是老师会对我们的答案进行修正,我们也会根据修正的知识不断迭代自己的知识体系,最终成为老师那样能根据各种问题输入都能输出正确答案的人”,其他两个人都点点头。

                                                                    

       “那么你迭代和修正的是什么?”

 

       路思:“是我的答案和正确答案的误差,比如我说去天津应该从南边走,您告诉我应该从北边走,那么下次我的答案可能是往偏北方向走,虽然还有偏差,但距离正确答案比之前近了很多。”

      

       “好,那么什么是导致路思知道是往偏北方向走的原因?”

 

       高维:“因为有正确答案告诉他啊,所有的答案都有我们的输出结果和正确结果两种,这也是监督学习的优势,可以根据正确与预测之间的差别去修正路线。”   

       “用最通俗的语言解释下什么是线性方程?”

 

       我:“一分钱一分货,钱与货有对应的线性关系。”

      

       “对数的理解是什么?”

      

       路思:“用一对数去代表一个复杂的数,对数将复杂乘除运算简化为加减运算和查对数表就能获得答案”

 

       “举个相对标准差的实际应用场景的例子。”

 

       果不出所料第一瓶饮料诞生了,高维连什么是标准差都不知道。按顺序轮到我来接着回答这个问题。

 

       我:“标准差可以反映一个数据的波动情况,这里我举的例子是股票的价格,如果该股票在一段时间内价格的标准差很大代表其非常活跃,股价经常有大涨或大跌,但单看标准差的话会有个问题,不同股票由于价格不一样,导致虽然标准差波动值一样,但实际的波动范围不一样,平均价格100元波动5元和平均价格10元同样差标准差是5元,但实际波动范围差别很大,所以引入相对标准差,也就是在标准差上面再多做一步,标准差与平均价格做个比值,一个是5除以100,另一个是5除以10,来描述波动幅度。”我解释的多一些,主要是希望高维能听懂。但杨导师没有搭理我说这么多继续问了下去。

 

       “回归与分类分别是解决是哪两类问题?”。

 

       路思:“回归是预测连续数值类型的,如根据之前天气状况和对应的温度预测今天的温度,而分类问题就是离散数值类型的预测,比如根据特征分辨猫,狗啊。”

      

       “路思说的离散型数据是指的哪类数据?”

 

       高维:“。。。。。。”

 

       杨导师:“路思你和高维一人一瓶饮料。路思再解释下离散数据,如果高维还不懂,继续买饮料。”

 

       路思面对这个结果有点吃惊,他高估了高维的数学水平,额头有点冒汗了,要解释最基础的定义的有时真是不好找到替换词语。

      

       路思:“还是说预测温度这个事情吧,温度是连续型数据你能理解吧,因为温度在一个区间内可以无限取值,38度,38.1度38.22度都可以是无穷尽的,但如果你说预测一个国家里面所有的城市温度时,那么这些个城市一定是有限个数量,而且每个城市都可以通过边界可分的,而且城市之间也没有什么连续关系,这样理解了么?”

 

       高维点点头,我心想路思顺便把连续数据也解释了,是怕高维连这个也不懂再被罚饮料。

 

       杨指导没有再追加这个问题,“高维,作为一个经常上网购物的女孩子,如果让你设计一个通过买家的信息来推荐给买家合适的鞋,你会选择哪些字段作为学习属性,不会选哪些,为什么?”

      

       高维:“首先我选择的字段肯定是买家之前的买到鞋的尺码,这个是必须的,还有买家在不同鞋品中描述页面的停留时间,这个属性可以将商品描述和用户对商品的关注度进行了量化,我不会选择之前购买鞋的式样,颜色等字段作为偏好,因为女孩子哪有老买同样的东西,推荐是个预购买行为,不是买完了再推荐类似产品的行为。”

 

       我心想要是我回答我一定会选式样,颜色等字段的,必须推荐用户一直使用的产品,男女有别,谁对谁错呢。

 

       “最后一个问题,安逸,你的哪个薄弱环节导致你来到战情室接受辅导的?”

 

       好么,这个问题和机器学习有什么关系,我哪里知道啊,评审组邮件通知我的啊,我想了想回答:不是我差,是别人比我更优秀吧。

 

       “恩,上午的游戏环节就到这里了,休息10分钟,开始一会儿的课程”,杨导师说完走出去了。

 

       八卦的路思见导师走了,又来了精神,跟我们说:“你知道这个杨导师么,我昨天晚上和HR的小姐姐打听过了,三年前才结的婚,但还没要孩子,说是要在北京买完房再生,之前在一家国企后来这边许诺了股份和期权,才挖过来的,由于年龄大了还没孩子,心理不太正常的,咱们都小心点吧。

 

猜你喜欢

转载自blog.csdn.net/yoki2009/article/details/88417398