计算机视觉经典书籍推荐

计算机视觉是人工智能的一个分支，主要研究如何使机器“看”的科学，通俗来说就是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。

无人机技术领域关于计算机视觉的应用也产生了不少优秀案例，如何更好的学习或深入计算机视觉呢?阿木实验室今天就为大家推荐一些计算机视觉值得阅读的经典书籍。

一、综合篇

1.《计算机视觉：算法与应用》

作者：Richard Szeliski

计算机视觉技术的初学者（本科生）提供了广泛的标准计算机视觉问题的坚实基础。这本书是由理查德根据他多年在华盛顿大学教授这一课题的经验编写的。具体课题包括：成像，图像处理，特征检测、匹配与分割，基于特征的对齐，基于运动的结构重建，图像粘贴，计算摄影学，立体对齐，三维重建，基于图像的绘制和识别等等。作者也提供了计算机视觉算法涉及到的线性代数、数值优化技术、贝叶斯建模与推理。

2.《计算机视觉：一种现代方法》

作者: 福赛斯(David A. Forsyth)/泊斯(Jean Ponce)

本书内容涉及几何摄像模型、光照和着色、色彩、线性滤波、局部图像特征、纹理、立体相对、运动结构、聚类分割、组合与模型拟合、追踪、配准、平滑表面与骨架、距离数据、图像分类、对象检测与识别、基于图像的建模与渲染、人形研究、图像搜索与检索、优化技术等内容。

二、几何篇

1.《计算机视觉中的多视图几何》

作者：Richard Hartley/Andrew Zisserman

用于理解真实世界的三维结构是计算机视觉领域的一个基本问题。内容包括三维几何与重建所需要的计算相关的几何原则及物体的代数表达。本书以统一框架的形式给出了场景重建的理论与实现细节。同时作者也提供了详尽的背景知识、应用和实现算法的解释。

2.《An Invitation to 3-D Vision》

作者: Yi Ma / Stefano Soatto / Jana Kosecká / S. Shankar Sastry

本书着重讲述了计算机视觉中的重要问题：利用线性代数和矩阵理论从一系列二维图像中重建三维结构和运动。本书的特点是一套基于多幅图像的研究几何和重建几何模型的统一框架，也包括了图像形成、基本的图像处理方法以及特征提取等内容，同时也给出实现视觉算法及系统的操作指南。

3.《计算机视觉：计算理论与算法基础》

作者：马颂德，张正友

本书阐述计算机视觉从信息处理的层次研究视觉信息的认知过程，以及视觉信息处理的计算理论、表达与计算方法。本书系统地介绍了计算机视觉的重要理论与算法，包括图像特征提取、摄像机定标、立体视觉、运动视觉(或称序列图像分析)、由图像灰度恢复三维物体形状的方法、物体建模与识别方法以及距离图像分析方法等。

三、OpenCV 篇

1.《Learning OpenCV 3》

作者: Adrian Kaehler / Gary Bradski

这本书的重点是教你如何使用opencv库，也许是首屈一指的开源计算机视觉库。所有的代码示例都在C++中，这表明目标受众是专业的开发人员，他们想学习如何将计算机视觉应用到他们的项目中。

2.《OpenCV 教程》

作者: 刘瑞祯 / 于仕琪

本书是国内第一本全面介绍OpenCV的中文版图书，对OpenCV开放源代码计算机视觉库进行了详细讲解。OpenCV由一系列 C函数和C++类构成，功能涵盖图像处理、计算机视觉和模式识别等领域。OpenCV实现了大量通用算法，涉及到图像处理、结构分析、运动检测、摄像机定标、三维重建以及机器学习等方面，并有较高的运行效率。书中所有实例均提供C/C++语言的源代码。

四、图像处理以及模式识别

1.《数字图像处理》

作者：冈萨雷斯，阮秋琦（译）

本书共12章，即绪论、数字图像基础、灰度变换与空间滤波、频率域滤波、图像复原与重建、彩色图像处理、小波和多分辨率处理等。

2.《模式识别》

作者：边肇琪，张学工

本教材系统地讨论了模式识别的基本概念和代表性方法，包括监督模式识别中的贝叶斯决策理论、概率密度函数的估计、线性判别函数、非线性判别函数、近邻法、特征选择与提取的典型方法以及非监督模式识别中的基于模型的方法、混合密度估计、动态聚类方法、分级聚类方法等，并在相应章节包括了人工神经网络、支持向量机、决策树与随机森林、罗杰斯特回归、B00sting方法、模糊模式识别等较新进入模式识别领域的内容。整体内容安排力求系统性和实用性，并覆盖部分当前研究前沿。

3.《模式分类》

作者：Richard O. Duda

模式识别和场景分析领域奠基性的经典名著。主要讲解统计模式识别和结构模式识别，以及许多近25年来的新理论和新方法，其中包括神经网络、机器学习、数据挖掘、进化计算、不变量理论、隐马尔可夫模型、统计学习理论和支持向量机等。

五、机器学习篇

1.《Computer Vision: Models, Learning, and Inference》

作者：Simon J.D. Prince

本书介绍了解决计算机视觉问题的概率模型学习与推理的方法，讲述了如何利用训练数据建立观察图像和要估计的内容的联系，例如估计三维结构。本书包括概率基础知识、概率图模型、图分割方法、多视觉几何、相机标定、人脸识别、目标跟踪等等。书中共介绍了70多种算法。

2.《Pattern Recognition and Machine Learning》

作者：Christopher Bishop

本书是第一本从贝叶斯的角度讲述模式识别，用图模型的方式描述离散概率分布的书籍。内容包括：线性回归模型、线性分类模型、神经网络、核方法、稀疏核方法、图模型、混合模型与期望最大化算法、近似推理、采样方法、连续隐变量模型等。

3.《深度学习》

作者：Ian Goodfellow and Yoshua Bengio and Aaron Courville

本书包括三大部分，第一部分介绍了基本的数学工具和机器学习概念，第二部分描述了最著名的深度学习算法，第三部分列举了深度学习研究前沿的想法及问题。

4.《Generalized Principal Component Analysis》

作者：RenéVidal, Yi Ma, Shankar Sastry

本书介绍了关于从一个或多个子空间或流形产生出来的，可能含有噪声、大误差或者异常的高维数据建模的数学理论和计算工作的最新进展，涵盖了用于子空间估计和分割的最新的代数的、几何的、统计的计算方法，并且给出了若干在图像处理、图像视频分割、人脸识别与聚类等问题的有趣应用。

微信公众号关注《阿木实验室》获取更多无人机技术干货，关注《阿木社区》获取更多学习课程信息。
社区论坛地址：bbs.amovauto.com 参与讨论。

计算机视觉经典书籍推荐

猜你喜欢