杂文散谈:关于三维视觉与深度学习的发展未来

作者:深蓝学院
链接:https://www.zhihu.com/question/56212310/answer/494372109
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

从知识结构本身以及企业招聘现状,两个方面回答一下。

计算机视觉主要分为2D视觉和3D视觉两大研究领域,2D视觉的研究内容包括:目标识别、目标跟踪、视频内容理解等;3D视觉的研究内容包括:基于图像的三维重建、目标三维姿态估计等。

从知识结构出发

当下,2D视觉领域被基于学习的方法统治,比如深度学习;3D视觉领域仍以基于几何的方法为主,虽然最近也出现了不少基于学习的方法的paper。基于学习的方法最火的就是深度学习,而基于几何方法最火的就是视觉SLAM。

以深度神经网络为模板的深度学习,在可解释之前,已经没有了exciting的进展,大多数研究在于网络结构调整,或者与其他经典的机器学习范式相结合(比如图深度学习,GraphDL);视觉SLAM相关理论也已经发展到了一定的成熟度,更多的关注在于解决落地产业化时遇到的问题。

但站在发表论文的角度讲,机器学习(尤其是深度学习)相对更容易一些,但大多数应用方向都已经被灌得差不多了;视觉SLAM方向发表论文主要集中在两方面:一是与基于学习的方法结合,比如与深度学习结合;二是与新的传感器融合,达到更好的效果,比如Event Camera。

从企业需求出发

今年大家普遍反馈竞争更加激烈,企业招聘过程中,更多的注重基础理论是否扎实,岗位与研究领域是否match。

尤其是在2D视觉领域,由于门槛相对比较低,部分人认为懂深度学习模型,跑过几个数据集,就可以了,结果简历面都过不了。会训模型和调参数就可以拿到高薪的时代已经过去了。

3D视觉领域,今年招聘岗位和薪资,都有了较大幅度的提升,究其原因在于人才稀缺。这是一个门槛比较高的领域,需要具备非常强的编程能力,以及数学基础(矩阵、优化等)。我们本身就处于3D世界中,相信3D视觉领域在逐渐迎来属于自己的春天。

建议

人工智能知识博大精深,各领域深度交叉融合。唯有深挖一个方向,夯实基础,才会立于不败之地,才会等来属于自己的机遇。

扫描二维码关注公众号,回复: 3398758 查看本文章

切忌广泛涉猎,但又浅尝辄止;切忌疏于实践,纸上谈兵。

怕什么真理无穷,进一寸有一寸的欢喜!

猜你喜欢

转载自blog.csdn.net/qq_25241325/article/details/82829662