荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: Rage (一代名蛙呱呱呱), 信区: CET
标  题: 计算机视觉8
发信站: 荔园晨风BBS站 (Sun Jul  8 07:52:25 2001), 转信

1.4 人类视觉与计算机视觉的比较
  目前人们所建立的各种视觉系统极大多数是只适用于某一特定环境或应用场合
的专用
系统,而要建立一个可与人类的视觉系统相比拟的通用视觉系统是非常困难的。主
要原因
有以下几点:
  1. 图象对景物的约束不充分。首先是图象本身不能提供足够的信息来恢复景
物,其
次是当把二维景物投影成二维图象时丧失了深度信息。因此,需要附加的约束才能
解决从
图象恢复景物时的多义性。
  2. 多种因素在图象中相互混淆。物体的外表受材料的性质、空气条件、光源
角度、
背景光照、摄象机角度和特性等因素的影响。所有这些因素都归结到一个单一的测
量,即
象素的灰度。要确定各种因素对象素灰度的作用大小是很困难的。
  3. 理解自然景物要求大量知识。例如,要用到阴影、纹理、立体视觉、物体
大小的
知识;关于物体的专门知识或通用知识,可能还关于物体间关系的知识等。由于所
需的知
识量极大,难以简单地用人工进行输入,可能要求通过自动知识获取方法来建立。

  4. 人类虽然自己就是视觉的专家,但它又不同于人的问题求解过程,难以通
过自已
说出自己是如何看见事物的,从而给计算机视觉的研究提供直接的指导。
  视觉机理的复杂深奥使有些学者不禁感叹道:如果不是因为有人的视觉系统作
为通用
视觉系统的实例存在的话,他都怀疑不能找到建立通用视觉系统的途径。从另一方
面来看
,正如Rossen所说的:"从进化的观点来说,生理系统是人类解决复杂问题的最好
的百科
全书。"对建立通用视觉系统这个难题来说,在长期进化过程中高度发展了的人类视觉系统
确实提供了最好
的实例
。例如,对人类视觉中可区别的独立视觉模块的研究就帮助我们认识了在没有先验
知识的
条件下初级视觉处理能否获得丰富的有用描述的问题。
  许多心理物理学实验证明在人的视觉系统中似乎存在独立的特定模块。其中著
名的例
子有Land[Lan 71]关于照明的计算和Julesz[Jul 71]关于立体视觉的实验。例如,

Julesz
的实验证明了人的视觉系统可在对图象的内容一无所知的情况下进行立体视觉处理
,获得
深度信息。他用计算机产生左、或两幅由随机点组成的图象。从单幅图象看,这两
幅图都
不过是由一些随机分布的点组成的图案,并无物理含义。但当用立体镜观察,把这
两幅图
融合在一起时就得到了
立体信息(详见第五章)。这说明在人的视觉系统中似乎存在着独立的立体视觉模
块。除
此以外还有其它的独立模块。Horn[Hor 75][Ike 81]研究了人类视觉根据影调得到
物体形
状的能力,steven[ste 81]研究了人对表面轮廓作出三维形状解释的能力等。更多
的有关
研究可参见[Bob
81]。显然,这些研究结果与70年代初期流行的认为初级视觉处理难以得到丰富的
有用描
述的观点相反,并且标志着80年代的计算机视觉研究的趋势与10年以前已大不相同
。其主
要特点是研究集中在与人类视视觉系统中的可区分的独立模块相应的课题上,并且
许多研
究者希望他们的工作能
与心理物理学和神经生理学的理论有直接的联系。从长远来看,建立人类视觉的计
算理论
,并进而建成可与人类视觉系统相比似的通用视觉系统是计算机视觉研究的最终目
标。对
人类视觉的研究涉及神经生理学、心理物理学、心理学等多方面。对人类视觉机理
的了解
释为建立视觉的计算理论提供有益的启示,与此同时,视觉计算理论的研究又促进了在上述
领域中引入计
算机技
术。这又推动了这些学科自身的发展。
  强调计算机视觉研究与人类视觉研究之间的紧密关系,并不意味着计算机视觉
系统要
机械地模仿人类视觉系统。因为生物视觉系统是生存竞争中进化的产物,带有由此
而来的
优点和局限性。[Bra 83][Per
83]其优点是具有高分辨率、有立体观察、优越的识别能力和灵活的推理能力,可
灵活地
根据各种视觉线索进行推理:
  1. 能否根据距离的远近对不同的物体,特别是对不同的生物作出不同反应的
能力应
该是视觉系统发展中的重要准则。视觉系统的优点在于不与环境直接接触就可以作
出响应
。如果视觉系统不能反应距离远近,那么就使视觉系统的这个优点受到严重限制。

  2. 应用视觉的初等生物体需要有能力自动地对环境的刺激作出响应。理解能
力是进
化的更高阶段中感知过程的结果。
  3. 感觉机制必然是在足以确保生存或对生存有利的基础上发展起来的。因此
不能认
为这些机制是利用了从数学或计算机观点来看的最优解。所以有必要具体分析人类
视觉系
统的特点。人类视觉系统大致有以下特点:
  (1)
深度感觉的首要性。可能初等生物体表面上的光敏区开始时只能提供关于光源的方
向信息
,或者阴影可能表示一个捕食动物正在逼近的方向。感光区域上感知的阴影面积的
增加可
能意着捕食者正在逼近,这可能是深度感知的早期形式。这样的进化过程只是一种
分析,
但是有依据说明在人类
视觉系统中探测阴影逼近的机能直接与感知物体在深度上的移动有关。对人类试验
者进化
的心理物理学实验和对猫进行的生理学实验都支持这样机理的存在。这种类型的机
理与Marr提出的从视网膜上的二维表象开始,经过一个或多个中间表象计算再作三维解
释的机
理不同。
  (2)
感知是个自动进行的过程。感知的特点在于它是一个自动进行的过程,并且它抵制
根据与
其相矛盾的知识作出修改。实验证明,如果让一个观察者先观察一个旋转着的收缩
螺丝,
那么在他习惯以后再去观察另一个物体,例如,一张人脸,就会感到人脸在膨胀。
观察者
可能可已经知道人脸并
没有膨胀,但这并不防碍得到这种膨胀的感觉。还有许多例子可证明人会出现这种
明知与
常识或已知情况相矛盾的感觉。
  虽然与感觉相矛盾的知识不能改变人的感觉,但显然它可影响人对视觉刺激作
出不同
的反应。一个人如果根据情况已知不会有大的物体正在逼近,那么当他看到出现一
个影子
时不会逃跑。但当影子突然出现时,他还会不自觉地感到害怕。人类虽然已具有较
高级的
理解能力,但视觉系统
似乎保留着对某种刺激自动作出反应的能力。从进化的观点,感知与知识相分离可
能是有
道理的,但对用于准确分析三维景物的视觉系统来说就是不可取的。
  (3)
感知中对启发式知识的应用。自然环境中的许多物体是刚体,所以在进行化过程中
发展起
来的人类视觉系统在根据视网膜上的物体投影分析物体时假设物体是刚体,以简化
分析是
有道理的。例如,如果视网膜上成象的大小变化,而形状保持不变,就可认为物休
的远近
起了变化。但在某些特
殊情况下,在分析成象的大小变化时视觉系统并不采用通常的刚性物体的假设,而
是采用
不同于刚性假设的其它特殊过程。例如,当在平面中旋转图1.5(a)所示的由两个螺
纹状图(图1.5(b)和(c))连接成的图形时,人在观察时通常会感到这是一个正在变形的
三维形
状。这种情况下在视网
膜上的成象是与刚体的运动不相符合的,也即图形在平面内旋转,而这个运动的刺
激图象
似乎给人以图形的一部分正在膨胀,而另一部分正收缩的印象。在刚体上是无法同
时造成
收缩和膨胀印象的。因此,这使人感到是一个正在变形的三维物体。这种感觉并不
因为刚
性物体的假设而消失。


图1.5 (a)(b)(c)这个二维图形在平面内旋转时,使人感到是一个非刚性的三维形
状,
(b)、(c),这两个图象在平面内旋转时似乎在膨胀或收缩,这要取决于旋转的方向

  在计算机视觉系统中如果在计算中保持物体的刚性假设就可以避免上述这种不
可靠的
感觉。虽然人类视觉中的这种近似过程有时会造成错误,但比单纯应用刚性假设可
能有下
优点:(1) 这样的过程使系统不致于过分偏向于刚体运动的感知,不然就会反过来
影响对
非刚体的感知;(2)
人类视觉系统所应用的启发式感知的过程对生理系统来说可能要比采用通用的刚性
物体假
设简便;(3)人类视觉系统对几何问题不采用产生严格求解方法的原因是这样可以
更为迅
速地求解。对动物的生存来说,一个可迅速地探测到潜在危险的近似求解方法比虽
然可准
确识别,但费时过多的
方法要有用得多。
  除了以上特点以外,人类视觉系统有分辨率高、识别能力优越、能进行灵活的
推理等
优点,以及在根据外部视觉成象推论物体三维形状或姿态时会产生严重错误的弱点
[Perkins
83]。综上所述,从建立通用的计算机视觉系统的角度来看,关键之点不是机械地
模仿认
类视觉系统,而是通过对人类视觉系统的研究发现是什么因素使人类视觉系统的性
能如此
之好,并且把它结合到计算机视觉系统中去。

--

※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.28.215]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店