基于卷积神经网络的目标检测算法研究

 2022-01-17 11:01

论文总字数:21809字

目 录

1引言 4

1.1 研究背景及意义 4

1.2 国内外研究现状 4

1.3 基于卷积神经网络的目标检测算法 4

2关于卷积神经网络 5

2.1神经网络 5

2.2卷积神经网络简介 7

2.2.1数据输入层 7

2.2.2卷积计算层 8

2.2.3激励层 8

2.2.4池化层 9

2.2.5全连接层 9

3基于卷积神经网络的几种目标检测算法的比较及相关拓展 10

3.1基于卷积神经网络的目标检测算法 10

3.1.1关于RCNN 10

3.1.2关于SPPNet————对rcnn的一次提速 13

3.2Fast-RCNN 15

3.2.1关于RoI pooling layer 16

3.2.2关于预训练 16

3.2.3关于微调(Fine-tuning) 16

3.2.4关于多任务损失 16

3.2.5关于小批量抽样 17

3.3 Faster-RCNN 17

3.3.1关于RPN 19

3.3.2训练RPN 20

3.4基于回归方法的深度学习目标检测算法————YOLO和SSD 21

3.4.1YOLO 21

3.4.2SSD 22

4关于Faster-RCNN的实验 22

4.1实验配置 22

4.2实验结果 23

4.2.1设计的网络结构1 23

4.2.2 参考AlexNet,VGG-Net,ResNet设计第二个网络结构 24

4.2.3将Relu改为PRelu 26

4.2.4增加Batch Normalization层 26

4.2.5引入Dropout操作 27

4.2.6使用ZFNet网络模型 27

5总结 35

参考文献 35

致谢 36

基于卷积神经网络的目标检测算法

贾云峰

,China

Abstract:This paper is based on the convolution neural network target detection algorithm, different from the traditional target detection method.It is a kind of detection method based on depth learning, which can learn and extract the characteristics of massive data.And because of the characteristics of the parameters shared by the convolution neural network, it reduces the human workload and greatly improves the operation efficiency. At present, there are various versions of target detection algorithms based on convolution neural networks, such as RCNN, Fast RCNN and Faster RCNN. In this paper, we focus on the Faster RCNN algorithm, and try various methods to conduct experiment.At last, it is proved that the target detection algorithm based on convolution neural network has better detection accuracy and higher detection efficiency than traditional target detection method. But there are also shortcomings

Key words:Depth study;Convolution neural network;Target Detection

1引言

1.1 研究背景及意义

人所皆知,现如今是信息时代,获得和处理信息的方式都有了极大的发展。人们能够获取知识、了解世界的一个重要途径就是通过图像,大量的事实表明,通过图像传达的信息量要比许多其他传达形式要丰富的多。人体眼睛和大脑的构造决定了人们能够接收和处理一系列视觉信息,视觉系统的存在保证了人们以视觉获取信息的高效率。据相关科学统计,在人们获取的信息中有百分之八十是来通过眼睛来实现的。因而可知,视觉既然已经是人类感知信息的最重要方式,要想实现计算机的智能化,首要任务就是能够处理图像信息。

尤其是最近以来,图像处理逐渐渗透到交通、医学等自动化领域,可以说它与我们的生活息息相关。日常生活中很少有一成不变的图像,它往往是运动着的,例如运动的汽车,行走的人等等。关于运动目标检测的研究显得越发有必要,它是计算机智能化里面关于图像的一个重要分支,已经在智能监控、航空航天事业、机器人导航以及工业检测等方面发挥着重要作用。因此,自然而然地运动目标检测也成为目前的热点研究方向。目标检测所力求解决的问题就是怎样迅速精确地定位出目标图像或视频中的运动目标,并将之提取出来。

之所以如此强调目标检测的必要性,皆因在现如今这个信息爆炸的时代,科学技术的进步与发展速度越来越快,生活工作的节奏也越来越快,相应地,生活工作的秩序也愈显紊乱 ,此时实时性的人口统计在维持社会秩序方面就扮演着重要的角色。例如:运用监控系统统计各时段电梯等候人数,整合优化电梯资源,以减少人们的等候时间,提升人们的生活质量。或者可以运用监控统计马路路口等交通繁忙之地的人口流动,方便相关部门合理高效地安排交警和安保人员的工作分配,大大提高服务效率。

1.2 国内外研究现状

计算机视觉是一门旨在以机器替代人眼实现“看”的学科,它通过电脑或其他设备对目标进行感知与理解。目标检测是一种基于目标几何和特征统计的图像分割,它的一项重要指标是检测的准确性和实时性。同时,目标检测作为计算机视觉的一个主要分支,既要对目标进行实时检测和分类,也要对目标进行分析,如交通工具或行人。当前,国外很多研究机构诸如牛津大学、麻省理工学院等均针对性的设立了关于目标检测方面的研究工作室。欧美等国也都在研究许多与之相关的项目。诸多大公司以及一些研究机构,如微软、IBM等也开始在智能监控系统的项目中投入大量资源来进行研究,其中取得的部分成果也都成功作为产品进入了市场。

再看国内,一些研究机构,如中科院下属的相关实验室的视觉监控技术处于先进地位。其在许多方面如行为模式识别、人的运动视觉监控以及交通厂家视觉监控等都有着较为深入的研究。与此同时他们基于英国雷丁大学VIEWS的关于车辆交通监控原型系统的研究,结合自身的理论基础,独立自主的研发出交通监控原型系统vstart(Visual surveillance star)。此外国内的其他一些高校如北京航空航天大学、上海交大等对目标检测的实际应用也有着一定研究。

但是,当前在目标检测方面的研究依然存在许多问题:首先是国内市场中流动的绝大多数智能监控产品都出自国外,国内自主研发的产品在性能上还有不足,且设备安装和维护问题无法自主解决,需要在外方人员的帮助下进行,国家安全得不到保障。其次多目标检测中存在的遮挡问题目前仍是难以处理。具体地,人数监测系统的研究正处于初步阶段,问题多多,当前比较热门的方法有基于卷积神经网络的检测方法,它将是本文着重探讨的方法。

1.3 基于卷积神经网络的目标检测算法

传统目标检测方法的提取效率和精确性已无法满足人们的需求,这时有人在经典目标检测算法的基础上,提出引入深度学习进行目标检测的想法,而Region CNN(RCNN)可以说是这种想法的最初版本。经过多年的平台检测后,结果显示目标检测的效率大为提高。本文下面将提到的Faster RCNN算法就是当前目标检测的先进水平。

基于卷积神经网络的目标检测算法,其实就是一种基于深度学习的目标检测算法,它可以从海量的数据库中自主学习特征,相比传统方法,它省却了人工构造特征的繁琐步骤。同时由于卷积神经网络本身就有参数共享的特性,为运算减少了许多工作量,大大提高了效率。

关于目标检测,本文要达到的目标是,在给定的任意一幅图片中,通过目标检测算法能有效快速的将目标物体在图像中的位置标注出来(即物体的边框bounding box)。目标检测在计算机视觉领域研究中有着重要的意义,因为它是人们能更进一步研究一些复杂视觉问题的前提。

2关于卷积神经网络

2.1神经网络

科学家做过这样一个实验,首先他们将耳朵到大脑上听觉皮质之间的神经链路切断,其次他们在眼睛和听觉皮质之间搭起了神经链路,经过实验发现这块原先的听觉皮质也学会了去“看”。紧接着科学家又对感知皮层做了同样的实验,结果显示感知皮层也同样学会了去“看”。由此,科学家推测出一个结论,那就是大脑有一套统一的学习机制,它可以针对给出的不同数据去学习,从而达到所要求的目的。下图即为各种相关实验:

图2.1 神经网络实验图

那么神经网络到底是什么。可以先引入一个逻辑回归算法,从而说明神经元到底是什么。首先导入一个线性公式:z=b w1x1 w2x2,令a=g(x)=1/(1 e⁻?)

其中b,w1和w2位常数。根据上述两个式子可以得到下图所示的过程:

图2.2 逻辑回归算法

通过以上过程,我们就可以将一个逻辑回归公式类比成一个神经元感知器。这是一种最基本的感知器,输入两个数,给出权重,通过某种函数得到一个输出。如果再在其中加入一些隐层,即是说在过程中间再加入一层神经元,这些神经元再次进行一些线性的组合,通过某种函数有了一个新的输出,就得到了一个浅层的神经网络。如下图:

图2.3 浅层神经网络

以此类推,如果加入足够数量的中间层,就形成了一个深度神经网络。如下图:

剩余内容已隐藏,请支付后下载全文,论文总字数:21809字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;