视频目标在线跟踪系统

 2022-10-02 09:10

论文总字数:32460字

摘 要

近年来,随着机器学习特别是深度学习的兴起,各种自动智能应用如雨后春笋般涌现。目前为止,深度学习已广泛应用于包括语言翻译、语音识别、图像分析、视频表示等领域,取得了比传统机器学习方法更加优越的性能。本文针对计算机视觉领域中的视觉目标跟踪这一基础和热点问题,初步探索了目前最先进的跟踪子以及其深层特征表示,并重点实现高效鲁棒的目标跟踪系统。具体地,首先对核化相关滤波(Kernelized Correlation Filter,KCF)跟踪器进行了原理上的剖析,细致地介绍了各种细节,并设计实现了一套具有尺度自动优化的实时目标跟踪系统。进一步,基于卷积神经网络(Convolutional Neural Network,CNN)高层特征的鲁棒语义表达,探索了深度学习下的核化相关滤波跟踪子,即深度对冲跟踪器(Hedged Deep Tracking,HDT),并设计实现了具有尺度自动优化的HDT目标跟踪器,由于其巨大的计算开销,使得该跟踪器无法在单块GPU设备上达到实时性要求。

关键词:机器学习,深度学习,目标跟踪,相关滤波,对冲算法

Abstract

In recent years, lots of auto intelligent applications emerge in large numbers with the growing machine learning especially deep learning. Up to now, deep learning has been used in fields like language translation, voice recognition, image analysis, video representation and so on. All of these applications have achieved greater success and performance than application with conventional machine learning methods. This paper focus on topic of object tracking, which is a hot and basic topic of computer vision field. Tentatively, I explored the state-of-the-art tracking element and its deep feature representation and achieve an effective robust object tracking system. Specifically, first, I did a deep analysis of the theory of KCF(Kernelized Correlation Filter) tracker and achieved a real-time object tracking system with auto-optimized scale parameter. Moreover, based on the deep layers’ semantic information of CNN(Convolutional Neural Network), I explored the KCF tracking element in the condition of deep learning, that’s to say HDT(Hedged Deep Tracker), and achieved a HDT with auto-optimized scale parameter. Because of the enormous computation expense, this HDT tracker can not be real-time system on a single GPU.

Keywords: machine learning, deep learning, object tracking, correlation filter, hedge algorithm

目 录

摘要 I

Abstract II

目 录 III

第一章 绪论 1

1.1 研究背景 1

1.2 国内外研究现状 2

1.3 论文研究内容及意义 3

1.4 论文组织结构 3

第二章 核化相关滤波跟踪器 5

2.1 线性回归 5

2.2 正则化相关滤波 5

2.2.1 循环位移 5

2.2.2 循环矩阵 6

2.2.3 归纳 7

2.2.4 与相关滤波的关系 7

2.3 非线性回归 8

2.3.1 核方法简介 8

2.3.2 快速核回归 8

2.3.3 快速检测 9

2.4 快速核相关 10

2.4.1 点积核、多项式核 10

2.4.2 径向基函数核、高斯核 10

2.4.3 其他核 11

2.5 实现细节 11

2.6 跟踪过程 12

2.7 本章小结 12

第三章 深度对冲跟踪器 13

3.1 对冲算法 13

3.1.1 在线学习决策论 13

3.1.2 对冲算法 13

3.2 深度学习 15

3.2.1 卷积神经网络 15

3.2.2 VGGNet-19结构 18

3.2.3 深层语义 18

3.3 深度学习与对冲算法结合 20

3.3.1 深度卷积神经网络特征映射 20

3.3.2 弱卷积神经网络跟踪器 20

3.3.3 对冲卷积神经网络跟踪器 21

3.4 本章小结 22

第四章 系统设计与实现 23

4.1 核化相关滤波跟踪器实现 23

4.2 深度对冲跟踪器实现 23

4.3 目标跟踪系统 24

4.3.1 核化相关滤波跟踪器案例 24

4.3.2 深度对冲跟踪器案例 25

4.4 本章小结 26

第五章 总结与展望 27

5.1 总结 27

5.2 展望 27

致谢 28

参考文献 29

附录A 31

绪论

研究背景

视觉是人类认知世界的重要途径之一,人类获取外部信息的80%来自视觉系统。机器视觉是人工智能发展进程上不可或缺的重要组成部分,所谓机器视觉,就是把由成像系统(如摄像机、照相机等)采集到的图像交给计算机进行处理和理解。在机器视觉这一类别下,又有很多小的分支,例如情绪识别、动作识别、人脸检测、视频目标跟踪等。目标跟踪是指对视频序列里所需要跟踪的目标进行识别,提取特征,预测目标位置等一系列操作完成的对目标行为的探测。

在跟踪这一课题刚刚兴起的时候,跟踪研究主要的焦点在目标运动模型的研究,如Kalman预测跟踪,粒子滤波跟踪等。近些年来,由于机器学习这一浪潮的效应,研究的重心已经发展到了目标表现模型的研究上,使用了先进的学习算法之后机器视觉课题的研究已经有了相当大的突破,并且很多学习算法已经应用在了我们的生活中。视频目标跟踪又分为在线和离线两种,在线系统的要素是实时性,在拍摄到目标后立刻处理目标信号,根据自身的检测结果对跟踪器进行更新。离线系统不需要很高的实时性,可以使用更加耗时的学习方法进行训练更新。在这个视频目标跟踪课题中会涉及到多方面的知识,包括机器学习,深度学习,数字信号处理,计算机视觉等。只有将这些知识结合起来,才可以完成一个既快速,又高效的视频目标在线跟踪系统。希望通过对视频目标跟踪的研究,可以让自己对机器视觉、机器学习有更深层次的了解,为自己以后在机器视觉方向的研究打下基础,锻炼自己的综合能力。

剩余内容已隐藏,请支付后下载全文,论文总字数:32460字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;