基于LSTM模型的行人重识别研究

 2022-05-14 07:05

论文总字数:33816字

摘 要

学生签名: 日期:

摘 要

行人重识别(Re-id)是在多个摄像头的监控视频中自动搜索指定行人的重要技术。由于设备,环境以及行人行为的多样性,Re-id的性能易受到尺度,视角,光照,遮挡,姿态变化等因素的影响,因此对兼具鲁棒性与稳定性的Re-id算法的研究具有重要意义。行人重识别工作主要包括特征提取与度量学习两部分,在行人特征提取工作中,我们运用Retinex图像增强算法,HSV颜色直方图以及尺度纹理算子(SILTP)捕获对光照鲁棒的特征,随后采用滑动窗口将图片分成若干子窗口,在每个子窗口提取特征,并采用最大化的融合方式对同一水平子窗口的特征融合来使特征对视点鲁棒,最后使用预训练的长短期记忆神经网络(LSTM)模型来序列地处理水平区域特征,并与已有特征串联,为特征向量增添空间依赖性信息。LSTM中的反馈连接与内部的门控机制使得我们的模型能够对空间依赖性信息选择性地记忆与传播,丢弃对行人识别无效的上下文信息。在度量学习工作中,我们使用了交叉视角二次判别分析,它是贝叶斯人脸和KISSME算法的改进方法,在降维的同时考虑了度量学习。该方法在学习度量空间的时候,学习新空间的距离度量方法,在这个空间中,相同类之间的距离较近,不同类之间的距离较远。我们在VIPeR,CUHK Campus,CUHK03数据集上进行实验,于Rank1识别率上分别取得了40.00%,50.66%,52.20%的成绩。在与目前最先进的算法相比时,我们的模型也表现出具有参考性的成绩。

关键字:行人重识别 局部特征最大化 空间依赖性 交叉视角二次判别分析

Abstract

Person re-identification(Re-id) is an important technique for automaticall searching for spe- cified pedestrians in surveillance videos of multiple cameras. Due to the diversity of equipment, environment and pedestrian behavior, the performance of Re-id is susceptible to factors such as scale, perspective, illumination, occlusion, and attitude change. Therefore, the research on Re-id algorithm with both robustness and stability is studied. It is of great significance. Re-id research mainly includes two parts: feature extraction and metric learning. In the pedestrian feature ex- traction work, we use image enhancement algorithm Retinex, HSV color histogram and scale texture operator (SILTP) to capture the characteristics of illumination robustness, and then adopt the sliding window divides the picture into several sub-windows, extracts features in each sub- window, and fuses the features of the same horizontal sub-window with a maximum fusion me- thod to make the feature robust to the viewpoint. Finally, the pre-trained long short term memory (LSTM) model is used. The horizontal region features are processed sequentially and concatena- ted with the existing features to add spatial dependency information to the feature vectors. The feedback connection and internal gating mechanism in LSTM enable our model to selectively memorize and propagate spatially dependent information, discarding contextual information that is ineffective for pedestrian recognition. In the metrics learning work, we used Cross-view Qua- dratic Discriminant Analysis, which is an improved method of Bayesian face and KISSME algo- rithm, which considers metric learning while reducing dimensionality. The method learns the dis- tance metric method of the new space while learning the feature subspace. In this space, the dis- tance between the same classes is relatively close, and the distance between different classes is far. We conducted experiments on the VIPeR, CUHK Campus, and CUHK03 datasets, and achieved 40%, 50.66%,and 52.2 % scores on the Rank1 recognition rate. Our model also show reference results when compared to state-of-the-art algorithms available today.

KEY WORDS: Rerson re-identification, Local feature maximization, Spatial dependency, Cross-view Quadratic Discriminant Analysis

目 录

摘 要 I

Abstract II

第一章 绪论 1

1.1 研究背景及意义 1

1.2 国内外研究现状 2

1.2.1 特征提取 2

1.2.2 度量学习 4

1.3 本文研究内容 6

1.4 论文组织结构 6

第二章 基于局部最大出现的特征提取 8

2.1 单尺度Retinex图像增强 8

2.2 HSV直方图特征 10

2.3 SILTP尺度纹理直方图特征 11

2.4 基于滑动窗口的局部最大出现特征 12

2.5 运用LSTM捕获空间依赖性 13

第三章 基于交叉视角的度量学习 16

3.1 贝叶斯人脸与KISSME 16

3.2 交叉视角的二次判别分析 16

3.3 实际计算问题 18

3.3.1 优化协方差矩阵计算复杂度 18

3.3.2 添加正则化项增强计算鲁棒性 18

3.3.3 特征子空间维度选择 19

第四章 实验 20

4.1 累积匹配特征CMC曲线 20

4.2 在VIPeR数据集上进行实验 20

4.2.1 VIPeR数据集介绍 20

4.2.2 实验参数设定 20

4.2.3 实验结果与算法性能比较 21

4.3 在CUHK Campus数据集上进行实验 21

4.3.1 CUHK Campus数据集介绍 22

4.3.2 实验参数设定 22

4.3.3 实验结果与算法性能比较 22

4.4 在CUHK03数据集上进行实验 23

4.4.1 CUHK03数据集介绍 23

4.4.2 实验参数设定 23

4.4.3 实验结果与算法性能比较 23

第五章 结论及工作展望 25

5.1 工作总结 25

5.2 工作展望 25

参考文献 26

致 谢 30

第一章 绪论

1.1研究背景及意义

随着摄像设备成本下降以及数据存储技术的不断发展,越来越多的监控摄像头被布置在诸如超市,道路,火车站等行人密集的公共场所,组成大型的分布式监控网络,所拍摄的海量视频在刑事侦查领域有着极高的应用价值[1][4]。目前人民对视频监控系统的应用还处于初级阶段,主要依靠人工的方式在冗长的视频流中寻找犯罪嫌疑人的位置信息。由于分布式监控网络的范围广,分辨率低,设备差异大,工作人员常需要耗费大量的时间和精力在海量视频中找到相关的信息,难以保证信息的时效性与准确性[2]。例如,在周克华案件中,南京和长沙的警务人员使用人海战术查看总量达1000T的监控视频,以此来挖掘破案的关键信息。因此,对多个监控视频同时处理并快速准确地搜寻到有效信息的视频分析算法就变得非常重要,具有极高的研究价值,逐渐成为了计算机视觉领域的研究热点。行人重识别算法(Person Re-identificationn,Person Re-id)正是为解决这一问题。

行人重识别意为在多台没有视场交叠的摄像机监控下对目标行人进行相似度匹配的过程,也即在多台位置不同的摄像机所拍摄视频中找到给定行人目标的过程。行人重识别的过程主要依赖于图像中所包含的行人特征[3]。如图1.1所示,由于行人姿态差异,环境遮挡,光照条件变化,摄像尺度不同,视觉改变等诸多因素的影响,即使是相同的行人,在不同的摄像头检测下也存在较大的差异,不同行人之间相似性也对算法性能有很大的影响。目前,行人重识别依然面临着严峻的挑战。

剩余内容已隐藏,请支付后下载全文,论文总字数:33816字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;