计算机视觉原理
计算机视觉就是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。
计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。
但是这个需要经过很长一段时间的的努力才可以达到的目标,所以,在实现最终目标之前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。

例如:计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现像人那样能识别和理解任何环境,完成自主导航的系统,所以,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。
这里要注意的是,计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理,这是人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。
计算机视觉发展史
计算机视觉最早可以追溯到1966年,著名的人工智能学家马文·明斯基给他的本科学生布置了一道非常有趣的暑假作业,他让学生在电脑前面连一个摄像头,然后写一个程序,让计算机告诉我们摄像头看到了什么,这被看做是计算机视觉的一个起点。
上世纪70年代,研究者开始去试图解决让计算机告知他到底看到了什么东西这个问题,研究者认为要让计算机认知到底看到了什么,可能首先要了解人是怎样去理解这个世界的,因为那时有一种普遍的认知,认为人之所以理解这个世界,是因为人是有两只眼睛,他看到的世界是立体的,他能够从这个立体的形状里面理解这个世界。
在这种认知情况下,研究者希望先把三维结构从图像里面恢复出来,在此基础上再去做理解和判断。
上世纪80年代,是人工智能发展的一个非常重要的阶段。80年代出现了很多方法,包括几何以及代数的方法,将我们已知的物品转化成一些先验表征,然后和计算机看到的物品图像进行匹配。
上世纪90年代,人工智能界又出现了一次比较大的变革,也就是统计方法的出现和流行。随着90年代统计方法的流行,研究者找到了一种统计手段,能够刻画物品最本质的一些局部特征,例如:要识别一辆卡车,通过形状、颜色、纹理,可能并不稳定,如果通过局部特征,即使视角变化了,也会准确对其进行辨识。局部特征的发展,其实也导致了后来很多应用的出现。例如:图像搜索技术真正的实用,也是由于局部特征的出现。
到2000年左右,机器学习方法开始盛行,在这之前需要通过一些规则、知识或者统计模型去识别图像所代表的物品是什么,但是机器学习的方法和以前是完全不同的,机器学习能够从海量数据里面去自动归纳物品的特征,然后去识别它。在这样一个时间点,计算机视觉界立交典型的代表有人脸识别。
机器学习的盛行其实是伴随着一个必要条件出现的,就是在2000年左右,整个互联网的出现和爆发,产生了海量的数据,大规模数据集也相伴而生,这为通过机器学习的方法来做计算机视觉提供了很好的土壤。
在这期间,出现了大量学术官方的,针对不同领域评测的数据集,其中人脸检测最具有代表性是一个叫FDDB的数据集,除此之外,在这期间,还出现了其他非常有影响力的数据集,其中比较有代表性的就是由李飞飞教授发起的一个项目IMAGEMET。
在2000年代,人工智能经历了一个快速发展期以后,整个人工智能在很多行业取得了非常好的应用,例如:视觉之外有搜索引擎排序和计算广告等等,视觉领域人脸检测器也被用在了各种各样的相机里面。
到2010年代,人工智能进入了一个最激动人心的年代,它就是深度学习的年代。深度学习从本质上给整个人工智能带来了一次革命。2006年Hinton教授在《科学》发表了对于深层神经网络的训练方法,带来了深度学习的蓬勃发展。
自2006年开始,在接近10年的时间里,整个计算机视觉界产生了质的变化,深度学习的出现真正改变了计算机视觉之前的定义。
文本由@邓邓 整理发布于三个皮匠报告网站,未经授权禁止转载。
推荐阅读:
【精选】2021年计算机机器视觉行业供需现状及相关企业分析报告(37页).pdf
【研报】计算机行业:计算机视觉龙头陆续申请上市行业景气上行-210124(14页).pdf
什么是计算机视觉?和机器视觉有什么区别?