基于深度卷积网络的人种识别算法研究与实现

 2022-01-17 11:01

论文总字数:27144字

目 录

第一章 引言 1

1.1课题背景与研究意义 1

1.2国内外研究现状 1

1.3本文研究目标与章节安排 1

1.3.1研究目标 2

1.3.2章节安排 2

第二章 神经网络和深度卷积神经网络介绍 3

2.1神经网络 3

2.1.1神经网络简介 3

2.1.2神经网络架构 4

2.2深度学习的介绍与发展 4

2.3深度卷积神经网络 5

2.3.1卷积神经网络简介 5

2.3.2卷积神经网络架构 6

第三章 人种识别深度卷积模型的构建 13

3.1 人种识别模型的训练流程 13

3.2 网络模型设计与构建 14

3.3 网络模型的训练和求解思路 15

第四章 人种识别深度卷积模型的实现与验证 17

4.1 Caffe框架的介绍与安装 17

4.2 训练以及测试样本的实验过程 20

4.2.1实现人种识别算法的训练过程 20

4.2.2测试训练结果 25

4.3 基于C#的人种识别程序的实现 26

第五章 总结与展望 30

参考文献 31

致谢 32

基于深度卷积网络的人种识别研究与实现

许正阳

,China

Abstract: Facial race recognition has attracted increasing attention and research because of its wide applications in identity recognition and security monitoring. In view of the success of deep convolutional neural network (CNN) in image analysis, this dissertation mainly focuses on the research and implementation of facial race recognition based on CNN. To be specific, firstly, we reviewed the background and related works; Secondly, we introduced related knowledge about neural networks and the CNN models; thirdly, a kind of CNN model was presented to perform facial race recognition and detailed its structure and implementation based on the Caffe platform, with effectiveness verification; finally, we conclude our work with specifying future directions. Last but not least, the proposed CNN model can be used to help estimate other facial attributes and their estimation model construction.

Key words: deep learning; convolution neural network; Caffe; facial race recognition

第一章 引言

1.1课题背景与研究意义

随着科学技术的发展,人工智能得到了飞速的发展。在这种情况下,人工智能必然会在人类以后的发展中起到非常重要的作用。深度学习算法是人工智能领域一个重要的研究方向,将学习的过程也由机器自己完成,这将是人工智能发展的重大趋势,对人工智能的发展有重要意义。

卷积神经网络是一类特殊的人工神经网络,在诸多领域应用特别是图像相关任务上表现优异,在前端的开发以及智能手机相关领域的研究有密切的关系。选取基于深度卷积网络的人种识别这一课题,有助于更深层次了解深度学习和卷积神经网络的知识,为以后更深入的研究打下基础。

在当下社会,图像识别技术运用最为广泛的就是人脸识别,因为人脸有种族、性别、年龄等不同但是又细微的差别,促使人脸识别的算法不断更新换代。本文研究对象为人种识别,针对不同种族的人群,对其进行划分。如今,人种识别已经运用在很多领域,如入关检测,身份登记,人流统计等方面,因此,研究人种识别技术有着重要而深远的意义。

1.2 国内外研究现状

根据目前国内的研究现状了解到,从二十世纪四十年代到六十年代控制论的提出,到八十年代的反向传播算法。随着科技的发展,人工神经网络在世界范围内迅速的兴起,国人也对神经网络领域有了浓厚的兴趣。1989年10月和11月分别在北京和广州召开了神经网络及其应用讨论会和第一届全国信号处理—神经网络学术会议,1990年2月由国内八个学会:包括中国电子学会、人工智能学会、自动化学会、通信 学会、物理学会、生物物理学会和心理学会联合在北京召开“中国神经网络首届学术会议”[10]

在国际上,1987年,在美国加洲召开了第一届国际神经网络学会.此后每年召开两次国际联合神经网络大会不久,该学会创办JournalNeu2ralNetworks,另有十几种国际著名的神经网络学术刊物相继问世.至此,神经网络理论研究 在国际学术领域获得了其应有的地位。

在公司的研究方面,Google在声音的建模方面使用了深层次的神经网络,大幅度降低了识别的错误率。 同时,在国内百度公司的深度学习研究领先于其他公司。其开发的PaddlePaddle深度学习框架,为开发者更是初学者提供了一个很好的平台,推动深度学习在国内的发展。

1.3本文研究目标与章节安排

1.3.1研究目标

深入了解深度学习概念,熟悉掌握卷积神经网络的原理通过对卷积神经网络的学习,了解其基本原理。能够运用深度学习框架Caffe,对已有样本进行训练,对人种识别估计得到比较准确的结果,并能对未知样本(未在样本集受过训练的样本)进行比较准确的人脸分析,并对其人种进行准确判定。大致分为以下步骤:

1.熟悉CNN,对卷积神经网络有大致的了解,熟悉基于caffe的深度学习平台,了解其他平台与caffe的区别。

2.准备训练所用的样本集,选择相对合适的样本,涉及到样本。

3.基于已经准备好的训练样本集,同时基于CNN网络进行种族判定估计器的训练,对训练的结果进行分析处理。

4.基于训练得到的种族判定估计器,对未见的测试样本,进行标签类别的预测使用深度学习的卷积神经网络模型实现了人脸识别技术。实验表明相比于传统的神经网络模型,卷积神经网络取得了更好的识别效果.

1.3.2章节安排

本文的结构安排如下:

第一章:绪论。主要阐述介绍深度学习卷积神经网络的定义,介绍了国内外研究领域的现状,说明了其课题背景和研究意义。

第二章:介绍神经网络的组成以及原理,分析人工神经网络和卷积神经网络的异同,深度剖析卷积神经网络的结构和原理

第三章:对人种识别算法流程进行初步的研究,选择图片集和训练网络,分析网络模型和数据模型。

第四章:训练人脸数据库,实现种族的分类,实现算法。

第五章:总结与展望。概括了本文提出的改进方法和所做的研究,与此同时,分析

总结了本文研究的不足,并且对今后的研究方向做出了展望。

  1. 神经网络以及深度卷积神经网络介绍

2.1神经网络

2.1.1神经网络简介

神经网络,与人脑的复杂神经不相同,它是人工的神经网络。它按照人脑的结构,目的为信息处理,建立一个复杂或是简单的数学模型,根据不同的排布合结构形成不同的神经网络。在工程和学术界,他们通常被简称为神经网络或人工神经网络[6]

人类从古至今对自身大脑的不断探索,即研究和模仿大脑的认知能力,造就了神经网络的雏形。在19世纪末,人脑的细胞结构被进一步探知,人类有了对大脑神经网络的初步认知。到了20世纪40年代,人们已经整合了生物物理学和数学相关知识,试图创造一种能够模拟神经元基本功能的机器。1943年,麦卡洛克等人提出了第一个神经网络模型MP模型。 1958年,F. Rosenblatt提出了着名的感知器模型,并且他还证明了双层传感器的收敛定理。这是第一个在世界上具有价值并且已经成为现代神经网络起点的神经网络模型[10]

图2.1是一个感知器的模型,感知器的功能是将两类事物加以区分辨别,虽然感知器有着非常简单的结构,它却有了神经网络的全部要素。感知器由输入和输出部分组成,输入部分为一个x向量,通过连接的权值,将x与w点积,再加上偏移量得到f(x)的值,通过f(x)的值对输入进行分类。

图2.1 感知器模型

在20世纪80年代,科学家们提出了各种神经网络。1988年,Broomhead和Lowe也提出了RBF网络(基于辐射的网络)。 1995年,Corinna Cortes和Vapnik提出了支持向量机(SVM)[21],图2.2所示的就是一个简单的神经网络,通过不同的节点相互连接,向量和权值、偏置的计算,激活函数的激活,最终输出一个关于x的函数值。

图2.2 简单的神经网络

经过十多年的努力,在人工神经网络的领域有了长足的进步,它成功解决了众多领域难以解决的实际问题,表现出了优越的性能。

2.1.2神经网络架构

一张完整的神经网络图大致可分为以下几个部分,如图2.3所示:

(1) 输入层(Input Layer):包含一个多维的输入向量,数据集所构成的向量集合组成了输入集。

(2) 隐含层(Hidden Layer):隐含层包含输入和输出向量,权值和偏置网络以及激活函数。隐含层可以不止一层,它的输入是上一层的输出和权重的点积向量,再放入激活函数进行计算,得到最后的输出结果。

(3) 输出层(Output Layer):由输入向量,输出向量和阈值构成。输出层只有一层,它的输出可能为一个损失函数(Loss Function),也可能是一个softmax分类器,算出机器认为最大概率的事物[1]

图2.3 神经网络的结构

剩余内容已隐藏,请支付后下载全文,论文总字数:27144字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;