计算机视觉早期技术

tamoadmin 球队新闻 2024-04-26 56 0

计算机视觉早期技术

计算机视觉是一门多学科交叉的科学,它的研究和发展历程可以追溯到20世纪50年代。以下是计算机视觉早期技术的一些关键点:

1.20世纪50年代

在这个时期,计算机视觉的主题主要是二维图像的分析和识别。1959年,神经生理学家David

Hubel和Torsten

Wiesel通过猫的视觉实验,首次发现了视觉初级皮层神经元对于移动边缘***的敏感性,揭示了视功能柱结构,为视觉神经研究奠定了基础。这一发现也为计算机视觉技术的发展提供了启示。同年,Russell和他的同学研制了一台可以把图片转化为被二进制机器所理解的灰度值的仪器,这是第一台数字图像扫描仪,处理数字图像成为可能。研究的主要对象包括光学字符识别、工件表面分析、显微图片和航空图片的解释等。

2.20世纪60年代

20世纪60年代,计算机视觉的研究开始注重三维视觉理解。1965年,Lawrence

Roberts在《三维固体的机器感知》中描述了从二维图片中推导三维信息的过程,这是现代计算机视觉的前导之一,开创了理解三维场景为目的的计算机视觉研究。同年,贝尔实验室的Willard

S.Boyle和George

E.Smith正在研发电荷耦合器件(CCD),这是一种将光子转化为电脉冲的器件,很快就成为了高质量数字图像采集任务的新宠,逐渐应用于工业相机传感器,标志着计算机视觉走上应用舞台,投入到工业机器视觉中。

计算机视觉早期技术

3.20世纪70年代

70年代中期,麻省理工学院(MIT)人工智能(AI)实验室:CSAIL正式开设计算机视觉课程。1977年,David

Marr在MIT的AI实验室提出了计算机视觉理论(Computational

Vision),这是与Lawrence

Roberts当初引领的积木世界分析方法截然不同的理论。计算机视觉理论成为80年代计算机视觉重要理论框架,使计算机视觉有了明确的体系,促进了计算机视觉的发展。

4.20世纪80年代

1980年,日本计算机科学家Kunihiko

Fukushima在Hubel和Wiesel的研究启发下,建立了Neocognitron,这是一个自组织的简单和复杂细胞的人工网络,包括几个卷积层(通常是矩形的),他的感受野具有权重向量(称为滤波器)。这些滤波器的功能是在输入值的二维数组(例如图像像素)上滑动,并在执行某些计算后产生激活事件。Fukushima的Neocognitron被认为是第一个神经网络,是现代CNN网络中卷积层+池化层的最初范例及灵感来源。

1982年,David

Marr发表了有影响的论文“愿景:对人类表现和视觉信息处理的计算研究”。基于Hubel和Wiesel的想法,David介绍了一个视觉框架,其中检测边缘、曲线、角落等的低级算法被用作对视觉数据进行高级理解的铺垫。同年,《视觉》(Marr,1982)一书的问世,标志着计算机视觉成为了一门独立学科。1989年,法国的Yann

LeCun将一种后向传播风格学习算法应用于Fukushima的卷积神经网络结构。在完成该项目几年后,LeCun发布了LeNet5这是第一个引入今天仍在CNN中使用的一些基本成分的现代网络。现在卷积神经网络已经是图像、语音和手写识别系统中的重要组成部分。

5.20世纪90年代

1997年,伯克利教授Jitendra

Malik发表了一篇论文,描述了他试图解决感性分组的问题。研究人员试图让机器使用图论算法将图像分割成合理的部分(自动确定图像上的哪些像素属于一起,并将物体与周围环境区分开来)。1999年,David

Lowe发表《基于局部尺度不变特征(SIFT特征)的物体识别》,标志着研究人员开始停止通过创建三维模型重建对象,而转向基于特征的对象识别。GPU是专门为了执行复杂的数学和***计算而设计的数据处理芯片。伴随着GPU发展应用,游戏行业、图形设计行业、视频行业发展也随之加速,出现了越来越多高画质游戏、高清图像和视频。

通过上述发展历程,我们可以看到计算机视觉早期技术主要包括二维图像分析、三维视觉理解、计算机视觉理论框架的建立、神经网络模型的应用以及特征对象识别的兴起。这些技术的发展为后续计算机视觉技术的快速发展奠定了坚实的基础。