基于计算机视觉的视频目标追踪与定位系统设计与实现

 2023-11-07 09:11

论文总字数:13306字

摘 要

计算机视觉的应用日渐成为科技领域的重心之一,在医疗、军事、交通、教育等领域都开始普遍应用。近些年,计算机视觉最广泛的应用领域大体可分为四类,即:人机交互、无人驾驶、视频监控、AR及VR技术。作为人工智能领域一个重要研究热点,一系列经典算法被提出,如CMT、meanshift、TLD、camShift等。本文研究的是基于TLD跟踪算法完成的视频目标追踪定位。但是尽管计算机视觉确确实实是在不断发展,在研究中心却仍有一些问题未能解决。典型的问题如光线变化较大、物体形状发生变化、目标物体被遮挡、目标物体运动速度过快等。本文主要研究使用卡尔曼滤波(Kalman filtering)对目标状态分析,并进行最优估计,以此来解决如上问题。

关键词:计算机视觉,目标跟踪,卡尔曼滤波,TLD

Abstract: The application of computer vision has gradually become one of the focuses in the field of science and technology, and has begun to be widely applied in medical, military, transportation, education and other fields. In recent years, the most widely used application areas of computer vision can be roughly divided into four categories: human-computer interaction, driverless, video surveillance, AR, and VR technologies.As an important research hotspot in the field of artificial intelligence, a series of classic algorithms have been proposed, such as CMT, meanshift, TLD, and camShift. This article studies the video target tracking and positioning based on TLD tracking algorithm.However, despite the fact that computer vision has been continuously developing, there are still some problems that cannot be solved in the research center. Typical problems include large changes in light, changes in the shape of the object, occlusion of the target object, and excessive movement of the target object.In this paper, we mainly use Kalman filtering to estimate the target state to solve the above problems.

Keywords: computer vision,target tracking,kalman filter,TLD

目 录

1 绪论 4

1.1 研究内容和意义 4

1.2 计算机视觉主要应用领域 4

2 安装配置指南 5

2.1 qt5.6配置OpenCV2.4.13 5

2.2 qt5.6配置ffmpeg静态库 7

3 OpenCV技术介绍 8

3.1 OpenCV的基本结构 8

3.2 OpenCV的基本数据类型 9

3.3 矩阵和图像操作 11

4 系统结构 12

5 各模块算法设计 13

5.1 TLD算法流程 13

5.2 数据处理模块 14

5.3 特征收集模块 14

5.4 分类器检测模块 15

5.5 目标追踪模块 15

5.6 滤波模块 16

5.7 分类器更新模块 16

5.8 数据编码模块 17

5.9 信息预警模块 18

6 系统测试 19

6.1 系统界面 19

6.2 系统测试 20

7 软件成果 24

结论 27

参考文献 28

致谢 29

1 绪论

一直以来,视觉都是人类认识世界了解世界的最主要途径。高新科技不断发展,对智能化的要求日渐加深,计算机视觉不可避免的被划入了研究的重心。与之密切相关的领域有视觉认知、视觉感知、图像视频分析处理等,笼统的说,计算机视觉就是赋予计算机“自然视觉能力”。在一些危险场合或人工视觉难以处理的环境下,经常需要使用计算机视觉代替人工视觉,以此打打提高工作效率。计算机视觉属于工程领域,是一门工科类综合性学科,糅合了计算机科学、统计学、物理学、应用数学等多门学科,在工业、农业、医疗、军事、航天等不同学科中都日益应用广泛[1]

1.1 研究内容和意义

据科学研究表明,视觉承担着人类八成以上的信息数据摄入工作。在解决“听”“说”问题的同时,我们也要教会计算机“看”,也就是图像识别,计算机将图片转化成二进制的数字流,然后输入深度神经网络,经过对视频中所产生的各层信息与现有的大数据进行逐步比对,以此来重新还原与识别出图片。

所谓“一图胜千言”,计算机视觉使用计算机来模拟人的视觉。在生活中,我们常常需要对物体的运动状态进行分析,如车辆运行,军事制导,公共安保等。

以交通监控为例,在交通监控中要对来往车辆的违规行驶等进行识别,对可能存在行人危险行为进行识别。在诸多领域,计算机视觉的重要研究意义都被逐步认可。

1.2 计算机视觉应用领域

(1)人机交互

人机交互主要包括人脸识别与检测、姿势识别、人体跟踪等。在医院、银行、办公所、交通等地应用广泛。

(2)无人驾驶

无人驾驶技术需要深入研究计算机视觉领域,过程大体分感知、决策和控制三个步骤。其流程为获取可行驶区域和障碍物信息、分析各像素物体移动方向和速度并对其检测追踪、对地图分析构建与定位。

(3)视频监控

计算机视觉在视频监控领域应用极为广泛,最典型的是在安保场所和交通路口的视频监控使用。其功能为利用计算机对视频中的人或车辆进行智能监控,节省大量人力物力。

(4)AR、VR的技术

剩余内容已隐藏,请支付后下载全文,论文总字数:13306字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;