杂文散谈：关于三维视觉与深度学习的发展未来

作者：深蓝学院
链接：https://www.zhihu.com/question/56212310/answer/494372109
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

从知识结构本身以及企业招聘现状，两个方面回答一下。

计算机视觉主要分为2D视觉和3D视觉两大研究领域，2D视觉的研究内容包括：目标识别、目标跟踪、视频内容理解等；3D视觉的研究内容包括：基于图像的三维重建、目标三维姿态估计等。

从知识结构出发

当下，2D视觉领域被基于学习的方法统治，比如深度学习；3D视觉领域仍以基于几何的方法为主，虽然最近也出现了不少基于学习的方法的paper。基于学习的方法最火的就是深度学习，而基于几何方法最火的就是视觉SLAM。

以深度神经网络为模板的深度学习，在可解释之前，已经没有了exciting的进展，大多数研究在于网络结构调整，或者与其他经典的机器学习范式相结合（比如图深度学习，GraphDL）；视觉SLAM相关理论也已经发展到了一定的成熟度，更多的关注在于解决落地产业化时遇到的问题。

但站在发表论文的角度讲，机器学习（尤其是深度学习）相对更容易一些，但大多数应用方向都已经被灌得差不多了；视觉SLAM方向发表论文主要集中在两方面：一是与基于学习的方法结合，比如与深度学习结合；二是与新的传感器融合，达到更好的效果，比如Event Camera。

今年大家普遍反馈竞争更加激烈，企业招聘过程中，更多的注重基础理论是否扎实，岗位与研究领域是否match。

尤其是在2D视觉领域，由于门槛相对比较低，部分人认为懂深度学习模型，跑过几个数据集，就可以了，结果简历面都过不了。会训模型和调参数就可以拿到高薪的时代已经过去了。

3D视觉领域，今年招聘岗位和薪资，都有了较大幅度的提升，究其原因在于人才稀缺。这是一个门槛比较高的领域，需要具备非常强的编程能力，以及数学基础（矩阵、优化等）。我们本身就处于3D世界中，相信3D视觉领域在逐渐迎来属于自己的春天。

人工智能知识博大精深，各领域深度交叉融合。唯有深挖一个方向，夯实基础，才会立于不败之地，才会等来属于自己的机遇。

扫描二维码关注公众号，回复： 3398758 查看本文章

切忌广泛涉猎，但又浅尝辄止；切忌疏于实践，纸上谈兵。

怕什么真理无穷，进一寸有一寸的欢喜！