第 1 章 绪论
1.1 研究背景
计算机图形学作为计算机领域的重要学科,其主要研究方向包含:绘制、建模、物理模拟、动画、可视化等延展的相关领域。计算机图形学的研究内容是可视对象的数字和成与操作,是一门面向“数字信息表达”的学科,而该领域的核心数字信息即为三维几何模型。所以,三维模型在精度、语义完善等方面的提升都将促进图形学中各个领域的发展,并且,图形学中各个领域的发展也迫切要求三维建模方法具有更高的精度、算法效率和普适性。
三维建模作为计算机图形学领域研究的重要组成部分之一,它广泛应用于工业制造、产品设计、影视动画制作等多个领域。三维建模过程是对几何信息的获取、处理、优化及分析。生成“立即可用(readily usable)”的完备三维模型是该领域研究人员长期追求的目标。近年来传感设备的精确化、实时化和低成本化,极大推动了三维模型数据获取的发展和普及。这也为三维建模领域提供了更广阔的发展和更严峻的要求。传统的三维建模主要关注模型的静态几何结构的获取,而对三维模型的分析与理解等操作都作为单独的课题对模型进行后续的优化操作,如模型分割[15]、运动提取[16]、模型拆解[17]、快速渲染[18]等相关研究。为了使建模的结果达到“立即可用”的标准,所建模型就需要富含更多的语义信息,从而使模型具有更广阔的应用领域。例如,获取模型的运动信息,可将模型直接应用于物理模拟的仿真领域;优化模型网格信息,可提高多分辨率(LOD)网格模型渲染速度;对模型进行拆解优化,可得到适宜三维打印的模型部件组。所以在建模过程中,要求算法不仅仅提取模型的几何信息,同时应该挖掘模型更深层次的语义信息。
..............................
1.2 研究现状
本文从三个方面回顾三维建模及模型优化技术的研究现状。首先回顾三维建模方法,该方法用于得到静态三维模型;其次回顾三维模型的运动提取方法,赋予静态三维模型运动语义信息;最后回顾三维模型网格的半规则化方法,该方法使模型具有多分辨率(LOD)的网格拓扑结构。
1.2.1 三维建模方法
三维建模作为计算机图形学中的重要组成部分,受到该领域内研究工作者的广泛关注。无论是商业领域还是研究领域都在三维建模方向展开了深入的研究。根据三维模型采集数据的方式不同,三维建模方法可以分为基于专业软件的、基于扫描设备的、基于图像的和基于交互式的建模方法。这些建模方法因为数据的采集方式不同,所以有各自的优缺点,也应用于不同的领域。
基于专业软件的三维建模方法。该方法是专业用户通过商用建模软件设计出所需要的三维模型。该方法在工业界应用非常广泛,如游戏产业、影视动漫、工业制造、多媒体等。通过专业软件建模是目前最普遍的建模方式,无论是大规模的城市场景,还是精细的工业机械零件,都可以由专业的建模软件来完成。常用的建模软件包括 3Dmax[19]、Maya[8]、SolidWorks[20]、AutoCAD[21]、Blender[22]、MotionBuilder[23]等。这些专业建模软件为用户提供全面的建模操作工具,用户可以自由调整多个观察视角,操作鼠标或画板绘制编辑模型,通过离散网格(如三角形网格)或光滑曲面(如 Nurbs 曲面)表达三维物体表面。专业软件不仅能够绘制出静态模型的几何形状,并且通过设置关键帧,来控制三维物体的运动动画,来完善三维模型的高层运动信息。不仅如此,专业软件同时也包含了对模型低层网格信息的简化、平滑等丰富的优化操作。同时,建模软件也具有专业的渲染功能,其渲染结果直接应用于影视、游戏等产业。其中 SolidWorks[20]、AutoCAD[21]等工业建模软件集成了众多机械零件和产品设计中的标准模块来辅助用户建立机械零件模型,并能自动分析运动仿真结果,其软件可以更高效地辅助工程师设计出工业级三维机械模型。总的来说,基于专业软件建模是工业界最普遍的建模方法,其优点的是工具众多,模型全面,应用范围广,但其缺点也同样显著:其一,专业的软件服务于专业的用户,想做出精致复杂的三维模型,需要具备专业的三维知识与熟练的软件操作能力,无法直接服务于广大普通用户;其二,普通用户习惯于在二维平面上绘制,直接在三维空间中建模对三维知识要求很高,对于复杂模型的建模往往工作量巨大,进一步提高了专业软件三维建模的门槛。
............................
第 2 章 基于多视角的交互式三维模型建模方法
2.1 引言
三维建模是将现实空间中几何物体数字化到计算机的过程,也是计算机图形图像学领域的重要课题之一。三维建模广泛应用于军事,医疗,城市建设,工业设计等众多领域,该研究为这些领域提供基础的数据支持。不同的应用领域对模型数据有着不同的要求,如模型的精度,场景的大小,建模的时间和建模人员的专业程度等因素,所以采用不同的建模方法。
根据输入数据的不同,目前主流的建模方法可分为:基于专业软件建模、基于三维扫描仪建模、基于图像建模和基于交互式建模。后三种建模方法是逆向建模过程,即采样已有的三维模型并数字化重建该模型,不同的建模方法根据其特点适应不同的应用领域。
基于软件的建模方法是通过有经验的建模人员通过图纸等信息在专业的CAD 软件上绘制模型。目前广泛应用的建模软件有 3Dmax、 Maya、SolidWorks、AutoCAD、Blender、MotionBuilder等商业级建模软件,如图 2.1a 所示,其建模优点是建模操作完备,模型精确,模型范围广,无论是精细的工业级模型还是大规模的城市建筑模型,都可以由专业建模工程师进行设计建造。但是该建模方法要求专业能力强,对于普通用户难于直接上手,需要长时间的专业培训。其复杂的操作和建模知识要求高等因素决定了该建模方法无法广泛适用于所有普通用户。
.............................
2.2 相关背景
2.2.1 基于多视角的三维建模
多视图三维建模的目标是从捕获的图像中创建完整的 3D 模型,其理论最早由 Hartley[27]等人在文献中进行了严格的表述。Seitz[105]等人对多种基于多视角建模方法进行了定量的评估。总的来说,主流的基于多视角三维建模方法主要包含三个步骤:首先是摄像机标定,
Zhang[26]等人通过拍摄标定板自动计算出照相机的内参数和外参数,Song[106]等人评估了多种摄像机标定的方法;其次是建立多视角下图像之间的稠密对应关系,Furukawa[107]等人通过建立稠密的多视角下图像间矩形片对应关系进行三维重建,Valgaerts[108]等人通过计算稠密光流得到多视角下图像间的对应关系,Ahmadabadian[109]等人利用多视角下图像间的对应关系进行多尺度重建;最后通过立体视觉中三角测量的方法计算出三维点坐标。基于多视角的三维重建方法不仅能重建室内的小物体,也可以重建室外大场景。例如,Snavely[5]等人通过旅行照片重建出著名景点,Agarwal[110]等人可以通过图像重建出整个罗马城市。
本章的工作受到了上述基于草图的启发,并且结合 Chen[14]等人的 3-sweep建模方法,其方法结合了图像边界信息和用户草图信息来重建三维模型。然而 3-sweep 方法是基于单视角的建模,即在单张图片上绘制草图,从而得到三维模型。而本章的工作期望重建由众多部件构成的复杂模型,由于单幅图片无法呈现模型的全貌,而且模型的内部细节大量被遮挡,从而无法重建模型所有部件的全部几何信息。本章的重建系统采用基于多视角的重建方法,并且支持结合模型稀疏点云信息和图像中边界信息来辅助用户交互式重建三维模型。
........................
3.1 引言 ......................... 35
3.2 相关背景 ............................... 36
3.2.1 多部件三维建模 ................... 37
3.2.2 模型运动分析 ........................ 37
第 4 章 基于部件运动优化的三维模型装箱方法 ..................... 55
4.1 引言 ........................ 55
4.2 相关背景 ............................ 57
4.2.1 可运动模型拆解 ........................ 57
4.2.2 装箱算法 .................... 57
第 5 章 三维模型网格结构的半规则化方法 ............................. 71
5.1 引言 ............................. 71
5.2 相关背景 ..................... 72
第 5 章 三维模型网格结构的半规则化方法
5.1 引言
近年来,随着计算机辅助设计和计算机图形学的迅猛发展,三维模型表面数字化表达已经成为该领域内的热点问题。模型曲面表达的发展,促进了模型制造、数字娱乐、增强现实、虚拟现实、医学图像处理、计算机模拟等众多领域。目前最流行的表面表达方式是使用多边形网格表达三维模型表面几何结构。由于结构简单、扩展性强、便于主流图形硬件设备计算等情况,四边形网格和三角形网格是学术界最普遍的作为多边形网格来表达三维模型表面的两种结构。
随着三维建模越来越自动化、智能化和便捷化,三维模型也来到井喷式发展的时代,所以快速优化网格结构是计算机图形学亟待解决的重要问题。优化网格结构主要目标是为了加快网格处理和增大网格压缩率。快速网格处理可以提高大规模场景渲染速度、复杂建模速度等。而网格压缩率增加能加快网格传输速度,降低传输带宽。半规则网格具有极好的可扩展性和可压缩性的特点,能够很好的解决上述网格处理遇到的难题。相比较非规则网格,半规则网格具有层次结构和规律结构,便于实现多分辨率网格分析,网格半规则化在文献[165]小波信号处理中首先被关注,之后被广泛应用于建模、模型分析、表面渲染等研究。半规则网格最显著的优点是网格数据可以多分辨率表达,这个优点被广泛应用在多个研究方向中。Certain [72]等人利用半规则网格的特性,进行可视化和渲染的时候可以在各级分辨率下高效的切换。Roudet[166]等人利用小波分析对半规则网格进行网格分割。文献[75, 167-171]都是利用半规则网格多分辨率的优点,对网格进行高压缩比的压缩。
............................
第 6 章 总结和展望
6.1 工作总结
三维模型的建模与优化研究是计算机图形学的重要组成部分,所建的三维模型也是图形学其他领域的基础数据。基于多视角图像的交互式建模方法可以使三维建模更广泛、更方便地面向普通用户,且能得到语义更完备、更精确的三维模型。具有完备的语义信息的特点使模型能够更广泛应用于其他研究领域,做到了“即建即用”的三维模型建模目标。
(1)本文首先提出了一种基于多视角图像的交互式建模方法,该方法通过用户在图像上绘制模型草图,计算出精确的三维模型信息。该方法交互方式简单直观,通过多视角图像得到的点云信息的引导,用户仅仅通过三笔操作就可以绘制出一个三维模型部件,大幅度降低了建模的复杂流程。多视角轮廓线与图像间匹配和基于数据驱动的部件间几何约束的优化,进一步优化了模型部件的几何参数,从而得到与真实照片完全匹配的精确三维模型。新颖的基于多视角的建模方法简化了传统三维建模的复杂流程,降低了建模对用户的专业性要求,多次优化提高了模型部件的参数精度。通过实验证明,本文建模算法能在半个小时内重建出具有部件间几何关联的复杂三维模型,且该模型不仅具有工业级精度,并能够直接通过 3D 打印得到真实模型。
(2)本文提出了一种基于模型视频序列与模型运动先验知识驱动的三维模型运动提取及仿真方法。三维模型的运动信息是蕴含在模型中的重要高层语义信息,该信息能够使所建模型应用更加广泛,如运动仿真、模型拆解等。该方法很好地解决了模型运动难于形式化描述、提取与优化的难题。传统的运动仿真需要该领域人员通过专业软件精心设计得到仿真结果。本文提出的方法可以从视频序列中自动提取模型的运动信息,降低了构建三维运动模型的门槛。本文提出的方法根据机械模型运动关节先验知识构建连接关节类型候选集,计算驱动轮运动参数,建立模型运动传递链,并建立三维模型剪影与图像边界匹配能量函数,通过对能量函数的优化,得到与视频序列中真实运动相同的模型运动参数。并且实验证明,通过 3D 打印得到的重建模型与原模型具有相同的运动效果。
参考文献(略)