七月在线BAT机器学习笔试题1-5

本系列题目来自七月在线实验室微信公众号,本人仅做一个学习笔记。

1.请简要介绍下SVM

SVM,全称是support vector machine,中文名叫支持向量机。SVM是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开。
  此外,这里有个视频也是关于SVM的推导:http://www.julyedu.com/video/play/18/429
--------------------------------------------------------------------------------------------------
 上面是微信公众号给出的解答,我认为很难概括这个问题。我这里给出一些补充。

 我想先给出一些高中的公式:对于SVM的推导是很有用的,因为我们可能很多人都把以前的公式忘记了。
以下截图来自:
三维空间中的平面
在这里插入图片描述
在这里插入图片描述
  在讲这个问题之前,我想先补充一下关于上面这个视频,这个视频仅仅是讲了SVM的一个基本型,或者叫硬间隔支持向量机(线性可分支持向量机)。同时我们常用的SVM调参的C与gamma在本视频中也没有介绍,所以想更全面了解SVM,视频是远远不够的。我这里把视频一些重要截图贴在这里,并做一些分析。
在这里插入图片描述
  这张图主要是说:以2分类问题为例,不同的算法都会给出不同的分类边界,左图是SVM的,右图的垂直于坐标轴的线往往是DT的,剩下两条可能是NN与logistic 回归给出的。总之是为了引出SVM中超平面的概念
在这里插入图片描述
这张图说的是±分类的点具有的几何意义。
在这里插入图片描述 这个式子其实是一个关键。这个式子其实就是n维空间中n-1维子空间的表示形式,空间中他是一个平面!在这个情形下,就要用到我上面的高中公式的截图了,具体就不说了。有数学基础的应该都可以联系起来。因为如果这个式子等于=0,就是超平面,>0为正类,就是在他上面,<0为负类,就是在他下面。
然后我们为了鲁棒性,对他要求更严格一些,让他大于1才为正类,所以有图中的说法。
在这里插入图片描述
这张图是重点了。如何推导(街宽),这里视频说的街道就是支持向量所在的平行于超平面的线。两条街之间距离就是width。简单说来就是两点相连的向量在法向量上的投影,自己推一下,概念忘了就去百度一下。
在这里插入图片描述
s.t.的意思就是限制条件的意思,constraint.
  这里说对他求max等价求在这里插入图片描述
  它的最小值,为什么要这样等价?后面就会看到了,用到lagrange优化时求导会方便一些在这里插入图片描述在这里插入图片描述
 这张图的话,就是一个lagrange乘数法。高数学过的,考研也考这个的。忘了就去百度百科在这里插入图片描述
 把w,b带回到L表达式中,其中α是未知量,要进一步求。视频到这里就结束了。
我建议以上视频仅供参考,有耐心的同学可以参看这篇文章。很长但很全。SVM
关于C,gamma的解释。C是软间隔支持向量机的参数,也是我们常用的参数,我认为C上文给了很好的解释,gamma是RBF径向基函数特有的参数,我认为下文讲得很好。
C与gamma

2.请简要介绍下tensorflow的计算图

Tensorflow是一个通过计算图的形式来表述计算的编程系统,计算图也叫数据流图,可以把计算图看做是一种有向图,Tensorflow中的每一个计算都是计算图上的一个节点,而节点之间的边描述了计算之间的依赖关系。
在这里插入图片描述
详情请查看:
https://www.jianshu.com/p/7805a9a8bd67

3.在k-means或kNN,我们常用欧氏距离来计算最近的邻居之间的距离,有时也用曼哈顿距离,请对比下这两种距离的差别。

欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,…,xn) 和 y = (y1,…,yn) 之间的距离为:
在这里插入图片描述
  曼哈顿距离,我们可以定义曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是在欧几里得空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。例如在平面上,坐标(x1, y1)的点P1与坐标(x2, y2)的点P2的曼哈顿距离为:
  在这里插入图片描述,要注意的是,曼哈顿距离依赖座标系统的转度,而非系统在座标轴上的平移或映射。
  通俗来讲,想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。而实际驾驶距离就是这个“曼哈顿距离”,这也是曼哈顿距离名称的来源, 同时,曼哈顿距离也称为城市街区距离(City Block distance)。
  另,关于各种距离的比较参看
  http://blog.csdn.net/v_july_v/article/details/8203674

4.

猜你喜欢

转载自blog.csdn.net/ssswill/article/details/84997694