1.关于K-means聚类算法，请回答以下问题：

K-means是有监督聚类还是无监督聚类？（2分）
写出将N个样本（X=(x1,…,xN)）聚成K类的K-means聚类算法的优化目标函数。（6分）
请用伪代码写出聚类过程。（8分）
假设样本特征维度为D，请描述Kmeans算法时间复杂度。（4分）

答案

1，无监督

2，优化目标函数：F(X,K) =i=1Kj=1Ni(xj-μi)2

3，聚类过程：

    初始化：从N个样本中随机选择K个作为初始聚类中心；

    For t=1:T（此处，T为最大迭代次数）

    将N个样本按距离最近原则分配给K个聚类中心；

    迭代更新聚类中心；

    如果达到终止条件，如全部样本归类无变化，或者样本点到聚类中心的平均距离变化率较低，则退出

4，时间复杂度：TNKD 其中T为迭代次数、N为样本个数，K为聚类中心数目，D为样本维度

2.相机模型有哪些参数，写出三维空间点到图像坐标投影公式。镜头畸变系数有哪几种，对应畸变矫正的公式表达？

答案

相机模型的内参数重要有：主点，焦距，畸变系数。（3分）

三维空间点到二维图像的投影公式：（10分）
Alt
镜头畸变：径向畸变和切向畸变。（2分）

径向畸变矫正公式表达：（3分）
Alt
切向畸变矫正公式表达：（2分）
Alt

3.系统设计题（20分）

在自动驾驶领域，障碍物的空间位置是很重要的信息。在不具备雷达等有测距能力传感器的情况下，如何仅通过单目相机计算出地面上目标的距离

答案

采用IPM（Inverse Perspective Mapping）方法来实现，IPM投影如下图所示：

原始图像
Alt

IPM转换后的图像
Alt

主要有两种方式来生成IPM图像

方案一：假设地面是平的，采用直接计算单应矩阵H投影的方式。手动或自动选取图像和三维空间点对应的4组标记点，计算出原始图像到IPM变换图像的单应矩阵H。因此图像坐标系中地平面上的任一点，乘以H矩阵后都可以计算出真实三维空间下的坐标。

方案二：同样需要地面是平的假设，通过标定出相机的内参数和外参数，投影换算出图像地平面和三维空间的关系。能够给出公式推导加分。

4.目前通过卷积神经网络进行检测的方法主要分为one-stage和two-stage，分别写出了解的对应的算法。在共性上两类检测算法有哪些差异？

答案

One-stage：yolov1、yolov2、yolov3、SSD、RetinaNet（2分）

Two-stage：Fast R-CNN、Faster R-CNN（2分）

Two-stage检测算法的共性，以faster r-cnn为例，使用了复杂的网络用于每个候选区域的分类和回归；ROI pooling后的feature channels数目较大，导致内存消耗和计算量都比较大。

One-stage检测算法的共性，从网络结构上看只是多分类的rpn网络，相当于faster rcnn的第一阶段，因此one-stage主要的优势是速度快。其预测结果是从feature map回归出目标的位置及分类，有的也采用了anchor的概念。而two-stage对上述结果进行roi pooling后会进一步细化，因此two-stage算法检测精度一般相对较高。还有一种观点是，two-stage的rpn部分相当于做了正负样本均衡，这也是two-stage检测效果相对较好的一个原因。one-stage算法对小目标检测效果较差，如果所有的anchor都没有覆盖到这个目标，那么这个目标就会漏检。如果一个比较大的anchor覆盖了这个目标，那么较大的感受野会弱化目标的真实特征，得分也不会高。two-stage算法中的roi pooling会对目标做resize, 小目标的特征被放大，其特征轮廓也更为清晰，因此检测也更为准确。

上述标红，回答出一点给4分，如果回答合理，不在上述答案中也加分。

百度2019校招计算机视觉方向

1.关于K-means聚类算法，请回答以下问题：

答案

2.相机模型有哪些参数，写出三维空间点到图像坐标投影公式。镜头畸变系数有哪几种，对应畸变矫正的公式表达？

答案

3.系统设计题（20分）

答案

4.目前通过卷积神经网络进行检测的方法主要分为one-stage和two-stage，分别写出了解的对应的算法。在共性上两类检测算法有哪些差异？

答案

猜你喜欢