《论语·卫灵公》有云:“工欲善其事,必先利其器”。3D打印要想真正走进千家万户,进入到人们工作生活的方方面面,必须要有杀手级的应用(Killer Application),给用户带来有价值的体验,让用户愿意为它不心疼地花钱。正如iPhone手机,虽价格昂贵,然而这并不妨碍iPhone成为大街上最流行的机型之一,根本原因就在于iPhone有强大的App Store(应用程序商店),里面有许多杀手级的应用软件,让你每天都离不开它。前面章节我们已提到过,智能数字化与3D打印密不可分。而本章将要详细介绍的视觉计算,正是智能数字化的重要组成内容。掌握好它,让它成为3D打印的“利器”,构建一个个让用户爱不释手的杀手级应用出来。


6.1
视觉计算:计算机视觉与计算机图形学的融合

视觉计算本身是一门很新的学科,它是计算机视觉和计算机图形学发展到高级阶段的交叉融合。下面我们就分别对这几个学科作一介绍。

计算机视觉(Computer Vision,简称CV是一门研究如何使计算机“看”的科学,更进一步地说,就是指用摄影机和电脑代替人眼对目标或环境进行感知、识别、跟踪和测量。人类的感官信息中,大多数是来自于视觉。

提示:

实验心理学家赤瑞特拉的著名心理实验指出:人类获取的信息83%来自视觉,11%来自听觉,3.5%来自嗅觉,1.5%来自触觉,1%来自味觉。

我们也可以把计算机视觉视为人工智能的一个分支。从这个角度来讲,可以认为计算机视觉的目的就是利用计算的手段来处理人类的视觉信息和实现对实际三维场景的智能理解。计算机视觉领域与图像处理、模式识别、射影几何、统计机器学习等学科密切相关。近年来,与计算机图形学等学科也有着很强的联系。

提示:

模式识别用于从特征空间到类别空间的变换,通俗地说,就是自动将物体分类,如识别出这张照片拍的是鹿,那张照片拍的马。具体来说:根据从图像抽取的统计特性或结构信息,把图像分成给定的类别。研究内容包括特征提取(参见6.2.1节)、特征选择(参见6.11.1节)、分类器设计(参见6.4)等。在计算机视觉中,模式识别技术常用于图像中某些部分(例如分割区域)的识别和分类。

最早的、且目前仍具有巨大影响的一种计算机视觉理论框架是由MIT教授David Marr(大卫·马尔,1945年~1980年)在1970年代末期提出的,在他看来,计算机视觉系统的输入是现实世界的二维图像,而输出应该是基于3D表示的定性的和定量的场景理解。在David Marr英年早逝之后,研究人员又相继提出了Active Vision(主动视觉)、Purposive Vision(目的视觉)、Qualitative Vision(定性视觉)等理论框架,但这些新框架并没有代替Marr框架,而是完善和丰富了Marr框架。国内从事计算机视觉研究的代表性机构有中国科学院自动化研究所的模式识别国家重点实验室,自1987年成立以来对计算机视觉进行了系统的研究,在计算理论框架、早期视觉处理、摄像机定标、三维结构重建、视频与医学图像理解等方向取得了一系列创新成果。

下面是计算机视觉的典型应用:

²  从一幅图像(或一系列图像,即视频)中自动提取、分割感兴趣的物体(例如提取人的面部);

²  从多幅图像或序列中自动提取场景的三维信息,如从几幅图片中实现对人体/人脸的三维重建;

²  在图像序列中自动跟踪有意义的移动物体(如跟踪停车场中可疑的人的去向);

²  从数字图像数据库中根据图像的视觉特征实现检索(如从犯罪记录库中查找特定的嫌犯人脸图像、指纹图像、虹膜图像);

²  根据摄像头抓取的实时信息进行交通监管。

下面我们介绍计算机图形学,Computer Graphics,简称CGCG这个简称相信更为人所熟知,主要目的是利用计算机产生令人赏心悦目的三维真实感图形。例如,我们看到的很多好莱坞大片(阿凡达、变形金刚、钢铁侠等)所展现的逼真炫酷效果就是用CG合成的。为此,首先要对图形所描述的场景进行几何建模(Modeling,再用某种光照模型,计算在假想的光源、纹理、材质属性下场景的光照渲染(Rendering效果。计算机图形学的研究内容非常广泛,如图形硬件、图形标准、图形交互技术、光栅图形生成算法、曲线曲面造型、实体造型、真实感图形计算与显示算法,以及科学计算可视化、计算机动画、自然景物仿真、虚拟现实等。国内从事计算机图形学研究的代表性机构有浙江大学的计算机辅助设计与图形学国家重点实验室。

/计算机视觉/遇见/计算机图形学/又如何?不管////相信/爱情,碰撞的火花诞生了。视觉计算(Visual Computing,简称VC主要研究利用计算机对视觉媒体数据(包括2D图像、3D模型、视频等)进行获取、分析、合成、智能感知、可视化、交互和操纵,其横跨计算机科学、数学、物理和认知科学。形象地说,视觉计算既有计算机图形学的逼真炫酷效果,同时又兼有计算机视觉的智能感知,集“美貌与智慧”于一体。国内从事视觉计算研究的代表性机构有中国科学院、浙江大学、清华大学、北京大学、北京航空航天大学等。此外还有一个专业的联盟组织“视觉计算特别兴趣研究组联盟”(SIGVCSpecial Interest Group on Visual Computing),网址为:http://www.sigvc.org/。该学术组织主要从事计算机视觉、计算机图形学和图像视频处理的前沿研究,致力于国际一流的科研成果产出。感兴趣的读者还可经常访问“视觉计算研究论坛”(http://www.sigvc.org/bbs)以了解更多内容。

计算机视觉、计算机图形学、视觉计算,这三者之间既有区别,又有联系。

²  计算机视觉是给定图像,来推断场景特性,实现的是从图像到场景的变换。即从二维图像数据中分析提取场景的信息,包括三维结构、运动检测、物体识别等。

²  计算机图形学是给定关于场景结构、表面反射特性、光源配置及相机模型的信息,最后生成图像。从某种意义上说,计算机图形学是计算机视觉的逆问题。

²  而视觉计算是个更广义的学科,它包含了计算机视觉、计算机图形学、虚拟现实和可视化,也可以看作是这些领域在3D、智能感知、人机交互上的交叉融合。

此外,表6-1对计算机图形学(CG)、计算机辅助设计(CAD)、3D智能数字化(即视觉计算VC)进行了详细的分析比较。

6-1  计算机图形学、计算机辅助设计、3D智能数字化的分析比较

 

计算机图形学

CG

计算机辅助设计

CAD

3D智能数字化

(视觉计算VC

数据表征

曲面

实体(CSG

曲面与实体

制造形式

不制造

减材制造

/减材制造

形状复杂度

不规则的曲面形状(一般要求流形曲面)

规则的体形状

不规则的曲面/体形状(支撑结构、中空、内嵌)

颜色纹理

表面纹理颜色

无纹理

表面纹理/体颜色

交互方式

2D鼠标

2D鼠标

2D鼠标、笔画、体感、脑力、3D鸟标

自动化程度

手动设计

手工设计

用于大规模批量生产

(半)智能化设计

用于大规模批量定制

物理力学

不考虑(除非物理模拟),因为应用场景为虚拟的比特世界

不考虑,因为加工时可用夹具等进行辅助

需考虑重力、粘力

时间维

考虑(连续动画,至少需25帧每秒)

不考虑

可考虑(关键帧,离散动作,)

应用时效性

短暂,用户一般只会观看一次动画和特效

长期功用,但大规模量产的工业产品千篇一律、一般不具反复观赏价值

个性化定制的实体打印作品,具有私人化特点,值得长久保存、反复观赏