基于单张图像的3D场景重构技术

 2022-09-21 09:09

论文总字数:32761字

摘 要

随着计算机视觉的发展,二维图像处理技术已经突飞猛进。但如何实现让计算机像人类的眼睛一样对物体有着三维空间的感知,三维重构技术基于此目的慢慢发展起来。对室内场景的理解在测量房间面积等方面有着重要价值,本文着重于室内布局恢复,并借助恢复结果估算室内面积。在大多数房间中,代表布局信息的边界被遮挡而且杂乱物体较多,要想直接检测边缘十分困难,本文基于消失点的计算,采样光线得到布局方向,同时借助表面标签,两者相互约束并且迭代地定位杂乱房间以更好的适应布局,利用结构化支持向量机学习方法,基于全局选取一组参数来最小化误差,排名后输出最终的3D边框,然后根据相机标定和投影原理,进行世界坐标和相机坐标的转换,完成面积计算。在200个训练集和100个测试集中,包括各种各样的室内场景:比如卧室,客厅,走廊等,实验表明本文的方法可有效恢复房间布局并估算面积,误差较低,而且可得出表面标签和消失点结合的方法在房间布局估计的准确度上,要高于这两种方法的单独使用,实用性较强。或新的见解,用词简洁、准确。论文摘要后还应注明本文的关键词3至5个。

关键词:室内三维重构,消失点,图像理解,几何标签

Abstract

With the development of computer vision, two-dimensional image processing technology has been advancing by leaps and bounds. But how to achieve the computer as the human eye as the object has a three-dimensional space perception, three-dimensional reconstruction technology based on this purpose slowly developed. The understanding of the indoor scene has important value in measuring the room area. This paper focuses on the indoor layout recovery and estimates the indoor area with the result of recovery. In most rooms, the boundaries of the layout information are blocked and cluttered, and it is very difficult to detect the edges directly. In this paper, based on the calculation of the vanishing points, the sampling rays are arranged in the direction of the layout, and by means of the surface labels, Iteratively locate the messy room to better adapt to the layout, the use of structured support vector machine learning method, based on the global selection of a set of parameters to minimize the error, ranking and output the final 3D border, and then according to the camera calibration and projection principles, the world Coordinate and camera coordinate conversion, complete area calculation. In the 200 training set and 100 test sets, including a variety of indoor scenes: such as the bedroom, living room, corridor, etc., experiments show that this method can effectively restore the room layout and estimate the area, the error is low, and can be drawn The combination of surface label and vanishing point is more accurate than the use of the two methods in the accuracy of room layout estimation.

KEY WORDS: Indoor three-dimensional reconstruction,Vanishing point,Image understanding, Geometric label

目 录

摘 要 I

Abstract II

第一章 绪论 2

1.1 三维重构国内外研究现状及意义 2

1.2 室内三维重构研究现状 3

1.3 本文主要研究内容 4

1.4 论文各部分内容概述 6

第二章 总体设计分析 7

2.1 方法概述 7

2.2 算法分析 7

2.2.1 消失点检测算法 7

2.2.2 结构化学习方法 9

2.3 本章小结 11

第三章 消失点计算 12

3.1 直线检测 12

3.2 直线分组 12

3.3 消失点确定 14

3.4 检查错误消失点 15

3.5 本章小结 17

第四章 布局生成 18

4.1 生成初步3D框 18

4.2 估计表面标签 18

4.3 排名候选布局 21

4.4 计算房间面积 23

4.5 本章小结 27

第五章 实验结果分析 28

5.1 定性分析 28

5.2 定量分析 28

5.3 本章小结 29

第六章 总结与展望 31

6.1 本文工作总结 31

6.2 未来工作展望 31

致 谢 32

参考文献 33

绪论

三维重构国内外研究现状及意义

如今人们的生活已经越来越离不开数字媒体,15年前电脑只能应付2D图形,现在系统设计的改进使处理3D场景成为可能,为我们的日常生活做出了巨大的贡献。三维重构正是这样将真实世界还原在计算机上,捕获真实物体的形状和外观,达到在二维图片中也可以认知三维世界的视觉效果,是计算机视觉一个重要研究方向。机器视觉的最高境界就是模拟人类视觉去感知世界,重构正是这一过程的最后而又至关重要的一步。使用三维重构可以确定对象的3D轮廓,得到轮廓以及图片上点的三维坐标,图像的重构涉及多学科和多领域的核心技术,比如计算机图形学,计算机动画,计算机视觉,计算机辅助几何设计(CAGD),医学图像,虚拟现实,数字媒体等。

三维重构在机器视觉领域属于高层视觉,在以物体为中心的坐标系中,恢复物体的完整三维图,识别三维物体,并确定物体的位置和方向。根据视觉方式划分:目前对于基于视觉的三维重建技术主要有:基于视频的三维重建、基于图片的三维重建。而基于视频的三维重建其实是在基于图像的三维重建基础之上。根据摄像机(图片)数目划分:对于基于图像的三维重建,主要有单目视觉法、双目视觉法、多目视觉法。目前三维重构方法主要分为两大类,主动法和被动法。主动法借助硬件,基于模型构建场景中的对象,比如利用激光测距仪来获取深度图,通过数值逼近方法重建3D轮廓。这种方法固然精准,但操作起来有仪器要求,场景要求,耗时耗力,鲁棒性不强。被动法是借助传感器测量物体表面反射的光,通过图像理解推断三维结构,这里的传感器就是相机,基于图像理解的重建就是根据阴影,纹理,立体声,运动,光度,剪影,散焦等一系列数字处理输出一个3D模型。本文讨论的是第二种方法,基本流程如下

剩余内容已隐藏,请支付后下载全文,论文总字数:32761字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;