在网易云课堂上学习计算机视觉经典课程cs231n,觉得有必要做个笔记,因为自己的记性比较差,留待以后查看。
每一堂课都对应一个学习笔记,下面就开始第一堂课。
这堂课主要是回顾了计算机视觉的起源及其后来的发展,有助于学者理清计算机视觉的研究主题和发展脉络。
首先介绍了计算机视觉的相关领域,因为它不仅仅关乎计算机科学,还涉及生物,物理,工程等等学科,是一门综合性很强的学科。
接着从物种大爆炸讲起
推测生物有了视觉后极大地扩张了活动区域,带来了生物的蓬勃发展。
接着讲计算机视觉在近现代的发展,这里省略,直接跳到近些年有重要意义的学术成果。
2001年Viola&Jones推出人脸识别算法haar检测器
1999年David Lowe推出sift特征算法
2005年和2009年分别出现HOG特征算法和DPM算法
除了算法上的改进,数据规模的增大也是推动计算机视觉发展的主因,甚至到了深度学习时代,是各种数据集推动着算法的演化。
以下分别是PASCAL VOC和ImageNet
那么计算机视觉究竟要解决哪些问题,比较重要的几个问题包括图像分类,目标识别,图像描述,图像分割,场景理解等
回到这门课本身,CNN对于计算机视觉有何帮助,可以说进入人工智能时代,CNN就是解决计算机视觉的全部。不过CNN的出现可是有些年头了,直到2012年Alexnet的出现引发了这一潮流。
最后是一些基本要求吧,python,线性代数,微积分,还有CS229(机器学习)的基本知识,都要掌握。