基于稀疏表示的运动目标检测

 2022-01-17 11:01

论文总字数:19973字

目 录

第一章 绪论 1

1.1 课题研究的背景和意义 1

1.2 国内外研究现状分析 2

1.3 课题内容和论文结构安排 3

第二章 稀疏表示基本理论 3

2.1 稀疏表示模型 3

2.1.1 稀疏表达和压缩感知 4

2.2 稀疏分解 5

2.2.1 信号的稀疏分解 5

2.2.2 凸松弛法 5

2.2.3 贪婪法 6

2.3 字典学习 8

2.4 本章小结 9

第三章 基于稀疏表示的运动目标检测 9

3.1 背景字典学习 10

3.2 检测方法 13

3.3 本章小结 13

第四章 实验结果与分析 13

4.1 实验结果 13

4.1.1 背景的提取 14

4.1.2 局部突变 15

4.1.3 非结构化的高频率的变化 16

4.2 结论及分析 18

4.3 对运动目标检测的展望 19

参考文献 20

致谢 22

第一章 绪论

1.1 课题研究的背景和意义

随着时代的进步,我们对自身的安全和隐私有着更加的关注,电子信息技术的进步也追随着时代的进步,视频监控给我提供了一定的安全和保障。而在视频监控中的图像正是本文所需要的对运动目标图像处理相关的一部分内容。运动目标的检测在一些应用上非常广泛,如交通的管理,各大车站机场人流的情况以及上面所提到的视频监控等,这项对运动目标检测的技术在如今的生活中越来越体现出其重要性。

当前,诸多学者对运动目标对象问题进行了深入的研究。然而由于视频序列在拍摄过程中受到噪声、数据缺失、背景变化、相互之间遮挡等因素影响,如何准确、快速、鲁棒地分割视频中的运动目标一直是计算机视觉研究中富有挑战性的问题[22],因而得到了研究者的广泛关注。

图1-1 复杂动态背景图像示例

在实践中,背景可能发生复杂的变化。这些变化可以在低频率。如上图1-1中复杂的动态背景图像。在对这些复杂背景进行处理时,容易产生误差。有的常规运动目标检测在背景提取时会导致运动目标幻影的现象,为之后的前景检测带来不好的结果。

随着稀疏表示研究的进一步深入,在模式识别,图像融合,图像超分辨率重建等领域取得了重要的研究成果。本项目拟研究一种新的基于稀疏表示的运动目标检测方法,对于提高目标检测的性能和准确性具有重要的理论意义和实用价值。

1.2 国内外研究现状分析

因为视频序列或者图像本身具有不同程度的复杂性,对运动目标检测的要求不同,目前还没有一种可以对所有场景下进行运动目标检测的技术手段[23]。本项目根据利用图像信息的不同方式,将运动目标检测算法划分为基于时域信息的检测与同时利用时域和空域信息的时空域联合,根据是否联机处理,可分为离线和在线两种情况。

  1. 时域与时空联合[21]

一般来说,基于时域信息的分割技术利用由目标的运动引起的视频图像序列帧之间的变化得到变化检测模板,然后对检测出来的模板进行模板填充、噪声抑制、轮廓平滑等操作,从而获取运动目标。基于时域信息的视频运动目标分割技术,大致可以划分为基于光流场的算法,基于帧间差分的算法与基于背景差分的算法等[21]

基于光流场的算法通过计算三维运动场投影到二维图像平面内,并利用背景区域与运动目标区域光流性的差异,从而完成运动目标检测。

帧间差分法利用视频序列相邻两帧图像相减得到差分图像,通过对差分进行基于阈值的二元判决,从而获取出运动目标[21]

背景差分法通过使用背景模型,训练样本(帧)中获得的参系数,通过新一帧图像与提取的背景进行差分来对运动目标完成检测[21]。同时,根据场景的变化动态地对模型参数进行更新。背景差分主要是对背景模型的获取与字典的更新。

通常情况下,当我们只选择空域信息的视频运动目标检测技术的时候,一般是无法对运动目标进行定义信息的,我们无法准确的对运动目标进行检测。当我们在使用时域信息的检测方法的时候,因为在一般情况下无法对背景进行精确的提取,检测到的运动目标往往不够精准,会产生很多的误差和异常效果。

(B)离线和在线

对于图像序列或者一些视频的检测可以分为离线和在线两种情况。离线视频处理结果一般以视频文件的格式存放在一些磁盘或者硬盘中。针对背景相减存在的一些问题(如背景的动态变化、目标与背景的相似性等),通过改进背景建模以及背景维护的方法,来使得提取到的背景和原来的图具有相对统一性,这样能够保证对运动目标检测后结果的误差和异常尽可能的小。

国内外科研工作者在对运动目标检测领域开展了大量的研究工作,通过一系列对运动目标的间实验可以发现相关的技术还有待提高,检测算法还远未成熟。视频中背景的变化,自遮挡和目标之间互遮挡的处理,背景动态的变化(海边的风和海水、烟、雨、雾、阴影、飘飞的柳絮)等给运动目标检测的研究带来了巨大的困难。

通过上文的叙述,本文对场景中连续图像或者视频序列为研究对象,以对运动目标检测为具体科学问题,通过对稀疏模型的优化问题转换,提取背景和前景检测,课题采用在线鲁棒字典学习使其能够对复杂背景相比常规方法有更好的自适应,进而高效的对运动目标进行检测,具有重要的理论意义和使用价值。

1.3 课题内容和论文结构安排

本文课题内容为日常生中,我们对运动目标检测的技术,技术的广泛性就需要技术的准确性和误差率,本文着重并对基于稀疏表示的运动目标检测技术的方法,理论,对其中的一些算法进行了介绍,研究和使用,最后能够对运动目标有一个准确的检测。本文结构安排为首先在第一章阐述课题的背景和意义,介绍并了解了当前课题研究的现状。在第二章中主要讲述了稀疏表示基本理论,对稀疏表示理论中稀疏分解的算法的理解和说明并且基于稀疏表示的模型介绍了几个常见的字典学习算法。第三章中重点对运动目标检测的研究,说明总体算法思路和其框架,在实验中所采用的在线背景字典学习算法,检测的方法。第四章中则是对上文使用背景字典学习的实验部分,通过本文使用的方法和常规方法在不同背景状态下结果的分析得出结论并分析以及对运动目标检测的展望。

第二章 稀疏表示基本理论

2.1 稀疏表示模型

假设我们用一个n*m的矩阵表示数据集x,每一行代表一个样本,每一列代表样本的一个属性,一般而言,该矩阵是稠密的,即大多数元素不为0。 稀疏表示的含义是,寻找一个系数矩阵A(K*m)以及一个字典矩阵B(n*K),使得B*A尽可能的还原x,且A尽可能的稀疏。A便是x的稀疏表示。它打算使用最小的非0系数来表示信号,从而简化了解决信号处理问题的过程。

稀疏表示模型表现为 ,其中y∈R^n为待处理信号,D∈R^(n*m)为字典,为稀疏系数,为稀疏度,它表示x中非0稀疏的个数。

南大周志华老师写的《机器学习》这本书上原文:“为普通稠密表达的样本找到合适的字典,将样本转化为合适的稀疏表达形式,从而使学习任务得以简化,模型复杂度得以降低,通常称为‘字典学习’(dictionary learning),亦称‘稀疏编码’(sparse coding)”块内容。

表达为优化问题的话,字典学习的最简单形式为: 

(2-1)
 
其中xi为第i个样本,B为字典矩阵,aphai为xi的稀疏表示,lambda为大于0参数。

上式中第一个累加项说明了字典学习的第一个目标是字典矩阵与稀疏表示的线性组合尽可能的还原样本;第二个累加项说明了alphai应该尽可能的稀疏。之所以用L1范式是因为L1范式正则化更容易获得稀疏解。具体可以移步机器学习中的范数规则化L0、L1与L2范数。字典学习便是学习出满足上述最优化问题的字典B以及样本的稀疏表示A(A{alpha1,alpha2,…,alphai})。

2.1.1 稀疏表达和压缩感知

在压缩感知模型中:

    (2-2)

x表示原始信号,A表示稀疏映射矩阵,n表示加性噪声,y表示压缩测量[15]。在此模型中,当原始信号x满足一定的稀疏性时,稀疏映射矩阵A的作用时,可以将其压缩到很小的向量空间里,即y的行数比x小得多,这也体现了稀疏理论的核心思想:将高维信号用低维信号来描述。

在稀疏表达模型里,我们用y表示原始信号,A表示字典,x表示原始信号在字典A下的稀疏表达[16],一般应用中,字典A是过完备的,即A的列数多余行数,这与压缩感知中稀疏映射矩阵是相洽的,在不考虑噪声的情况下:   

  (2-3)

将x做自变量,可以看到这个方程未知数的个数多于方程个数,也即这个方程要么有无穷多个解(当增广矩阵[A,y]的秩=矩阵[A]的秩时),要么无解(当增广矩阵[A,y]的秩gt;矩阵[A]的秩时),我们当然是考虑有无穷多个解的情形。学者告诉我们应该找到最稀疏的那个解,也即中非零元素最少的那个解是我们需要的,也即优化下面一个问题:    s.t. y=Ax   或者统一成一个表达式: 

(2-4)

在数据拟合项之前,在稀疏约束J(x),L0,x和L0-norm之后,范数是统计x中非零元素的数量,但L0表示范数函数是非凸的,我们不能保证最后的结果是我们想要的最优解,但在一些实际生活包括其他的应用中,我们不需要获得最佳解决方案,例如在应用图像去噪的实验或者项目中,我们可以应用L0范数模型,效果达到了state-of-the-art,以色列迈Michael Elad为代表的学者是使用L0规范建模,如KSVD和Double Sparsity模型。或者我们考虑L1范数,虽然L1范数不能保证全局唯一的最优解,因为L1范数严格意义上不凸,所以L1范数可以实现稀疏效应,并且一般能够满足实际应用中的效果,如以法国的Julien Mairal,FrancisBach,Jean Ponce为代表的学者就是以L1范数来建模的。上面所提到的在相关研究领域是占很重要的地位的,许多基于他们的研究来进一步发展相关研究工作。

从上面稀疏表达和压缩感知的模型中,中心思想是一样的,y作为压缩测量或原始信号,联系上面所说的A,利用L0,L1范数模型,可以获得x的相应结果,但是在压缩感知中,感知矩阵A是一开始就已知的,当只有0与1的稀疏矩阵(binary sparse matrix),像在用BSBL_BO算法处理胎儿心电图中信号时采用的方法,取得了预期良好的效果。另一方面在稀疏表达领域,可以使用相关的方法得到我们所想要的字典,这样的字典比预先定义好的字典有更好的自适应性,这种思想和方法应该可以在压缩感知中体现出来。

2.2 稀疏分解

2.2.1 信号的稀疏分解

获取信号在过完备字典下的最优稀疏表示或系数逼近的过程叫做信号的稀疏分解,这是稀疏表示能否在图像处理中应用的基本问题。我们通常有两种稀疏分解的算法,一种是凸松弛法,另一种是贪婪法。

2.2.2 凸松弛法

凸松弛法中常见的算法有基追踪(BP),基追踪去噪算法(BPDN)[13]等等。

剩余内容已隐藏,请支付后下载全文,论文总字数:19973字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;