基于深度卷积网络的人脸识别算法研究与实现

 2022-01-17 11:01

论文总字数:31115字

目 录

1 绪论 1

1.1 研究的目的和意义 1

1.2 人脸识别国内外研究现状 1

1.2.1 国外 1

1.2.2 国内 2

1.3 人脸识别技术的发展 2

1.4 本文工作与安排 3

1.4.1 本文主要工作 3

1.4.2 论文结构安排 3

2 卷积神经网络相关理论 5

2.1 卷积神经网络的基本结构 5

2.2 卷积神经网络的改进策略 6

2.2.1 卷积层 6

2.2.2 池化层 6

2.2.3 激活函数 7

2.2.4 正则化 9

2.3 卷积神经网络的主要应用 10

2.3.1 计算机视觉 10

2.3.2 自然语言处理 13

2.3.3 语音识别 14

3 深度学习框架Caffe介绍 15

3.1 Caffe简介 15

3.2 Caffe的结构 15

3.3 Caffe的特点 15

3.4 Caffe的使用环境 16

3.5 Caffe在Windows系统下的安装 16

4 人脸识别深度卷积模型的实现与测试 19

4.1 CaffeNet模型介绍 19

4.2 Olivetti Faces人脸库简介 22

4.3 数据准备 22

4.4 数据转换 22

4.5 均值计算 24

4.6 训练网络 24

4.7 测试网络 26

4.8 改进实验 27

4.9 效果测试 30

5 总结与展望 32

5.1 工作总结 32

5.2 工作展望 32

参考文献 33

致谢 36

基于深度卷积网络的人脸识别算法研究与实现

沈贝怡

, China

Abstract:Face recognition (FR) is an important research topic in the field of computer vision. With the development of artificial intelligence, the research and algorithms related to FR have been on the way of progress. In this dissertation, firstly, we reviewed the research history and introduced the Convolutional Neural Networks (CNNs) in the field of FR; Then, we introduced the model structure, remodeling strategy and its applications; Thirdly, presented the architecture and advantages of Caffe, a typical deep learning platform; Fourthly, we constructed a CNN model for FR on the Caffe platform; Fifthly, we performed model training, testing and analysis over the proposed FR deep model; Finally, we conclude our work. It is worth noting that the proposed FR model can be used to safety monitoring and identification applications.

Key words:Face recognition; Deep Learning; Neural convolution network; Caffe

1 绪论

1.1 研究的目的和意义

近年来,作为人工智能和模式识别研究热点的人脸识别在全球范围内得到了迅速发展。 自从20世纪90年代以来,就有许多的科学家和商业机构开始对人脸识别进行了深入的探究,发明了许多的算法与应用软件。

人脸识别技术目前具备广阔的应用前景。其最初的应用来源于公安部门对犯罪照片和犯罪侦查的档案管理。随着科学的发展和社会的进步,人脸识别已经出现在国家安全,社会保障和公共安全等领域。典型应用如身份认证,智能访问控制,视频画面监控和图片检索等。

人脸识别和指纹检测、虹膜检测、DAN检测等传统的生物特征识别方法比起来具备更多的优势。首先,人脸图像易于采样,可以避免与待检测人物接触,不会打扰被检测人。其次,人脸识别方法的成本较低,用手机或数码相机等常用摄像设备就可以完成人脸图像的采集,不需要用到什么精密的仪器;最后,人脸识别过程可以自动完成,用户或测试员不需要主动参与到整个识别过程中,计算机会用设定好的方法自动执行识别任务。

人脸识别研究也有也很具有挑战性。由于人的外表、年龄、性别、种族等不同因素的影响,人脸具有多样性;在人脸识别中,可能有眼镜、帽子等附属物品,影响识别结果;人脸在有光照的条件下会产生阴影,这必定会对识别结果产生影响。如果能够成功解决这些问题,就能创造出比较完善的人脸识别系统,同时这对解决其他类似复杂的识别问题也具有重要的参考价值。

1.2 人脸识别国内外研究现状

人脸识别技术诞生于20世纪60年代,受限于当时的技术水平,并没有取得伟大的成就。从70年代到80年代,有了进一步的研究,但都是基于小样本图像集。20世纪90年代以后,得到了巨大的发展,多种人脸识别算法和人脸识别软件如雨后春笋版涌现。

1.2.1 国外

在过去的十年中,人脸识别作为一种新兴的生物特征识别技术逐渐流行起来。许多国外有名的研究机构和大学都在研究人脸检测与识别技术与理论,主要研究的国家有美国,欧洲国家,日本等。

研究机构包括美国的卡内基梅隆大学的机器人研究所,麻省理工学院的媒体实验室和人工智能实验室,英国的萨里大学视觉语音和信号处理中心,法国的国家信息与自动化研究所,芬兰的赫尔辛基大学的CIS研究所,瑞士的IDIAP研究中心,日本的国际电气通信基础技术研究所等。

国外有许多大学研究人脸识别。美国德克萨斯州达拉斯大学的阿卜迪和图尔团队,主要研究人脸感知模式;斯特林大学的布鲁斯教授和格拉斯哥大学的伯顿教授一起工作,专注于大脑在人脸识别中的作用;英国阿伯丁大学的克拉小组,专注于脸部视觉表现的研究;荷兰格罗宁根大学的佩特科夫小组,探索了人类视觉系统的神经生理学机制,并以此为基础开发了并行模式识别方法。

谷歌、微软和脸书等互联网巨头也投入了大量精力和资源进行人脸检测和识别的研究,并在其产品中配置能够使用的人脸检测和识别系统,以开发新的应用程序或改善用户体验。

1.2.2 国内

国内关于人脸识别的研究始于20世纪90年代,虽然起步较晚,但随着国家日益国际化,正在发展迅速中。主要的研究单位有中科院计算机所,中科院自动化所,清华大学,南京大学,复旦大学,中山大学,浙江大学等。

四川大学的周激流教授和张晔教授研究出了基于动态模板和活动轮廓的人脸识别方法[1];中国科技大学杨光正教授等提出一种在复杂背景中定位人脸的方法[2],该方法建立在镶嵌图上;清华大学彭辉、张长水教授等对“Eigenface”的方法实现了进一步的改进[3];南京理工大学杨静宇教授等提出了一种基于奇异值分解的特征抽取方法[4]进行人脸识别研究;程永清,庄永明等提出了基于投影图像的人脸特征抽取方法[5]。2000年5月,中国科学院与银晟网络有限公司共同建立了国内首家专门研发人脸图像识别核心技术的实验室,以研究计算机视觉、模式识别和机器学习等相关技术为主要目的。

目前,国内着名的人脸识别公司包括云从信息科技有限公司和旷视科技有限公司等。大部分云从的技术人员来自世界一流大学和研究机构。云从科技开发了第一个刷脸支付系统和第一个商用人脸远程开户系统。同时云从科技也是唯一一家参与人脸识别多项标准制定的研发公司;旷视科技开发了FaceID在线身份验证,Face 智能服务平台,地产解决方案等业务,目前已经开始在金融,安全和零售领域进行商业探索。

1.3 人脸识别技术的发展

到目前为止,人脸识别的研究已经走过了四十年。根据自动人脸识别的特点,如研究内容和技术手段,人脸识别的发展历程大致分为以下三个阶段[6]

第一阶段是1964年至1990年。在这个阶段,研究者们广泛采用的人脸识别方法是基于人脸的几何结构特征的方法。该方法主要由重要人脸特征,人脸识别特征向量之间的相对位置以及特征之间的距离组成,人脸识别通过特征向量之间的匹配来实现。但是,由于这个方法的识别效果一般,并没有在实际场景中被应用。这个阶段的主要代表是人物是布莱索,戈德斯坦,哈蒙以及金出武雄。受限于当时的技术条件,该阶段基本没有什么显著成果和实际应用。

第二阶段是1991年至1997年。虽然时间相对较短,但这个阶段对人脸识别的发展起着重要的作用。在这段时间内,人脸识别领域百家争鸣,大量具有代表性的人脸识别方法诞生了。麻省理工媒体实验室的图尔克和彭特兰提出了基于“特征脸(EigenFace)”的方法[7],这是具有划时代意义的解决方案,此后的许多人脸识别方法是在EigenFace的基础上进行改进的;耶鲁大学的贝吕默等人提出的Fisherface人脸识别方法[8],这是当时另一项重要方法,该方法至今依然是人脸识别的主流方法之一,并且已经衍生出许多变种;马尔斯堡等人提出了基于Gabor变换的弹性图匹配技术(Elastic Graph Matching,EGM)的识别方法[9],这个方法的思想是用一个属性图来描述人脸,这是人脸识别的另一种重要方法;洛克菲勒大学的艾提克等人提出了局部分析技术(Local Feature Analysis,LFA)[10]。此外,美国的FERET(Face Recognition technology Test)项目赞助了一些人脸识别研究,创建了当时最大的人脸图像数据库—FERET数据库,组织FERET人脸识别性能评估,推动了各种算法的改进和实际应用,人脸识别进一步的发展方向得以明确。总而言之,这一阶段的人脸识别技术的发展可以说是十分的快速,超过了之前几十年的发展,也为后来人脸识别技术的进一步发展打下了基石。

第三阶段是1998年至今。这个阶段主要是基于上一阶段进行更深入的研究。这个阶段的研究热点是非理想条件下的人脸识别。非理想条件是指光照变化,动作变化以及障碍物遮挡等。乔治亚兹等人提出的在多姿势和多光照条件下基于光照锥(Illumination cones)模型的人脸识别方法[11],是这一时期的一个重要研究成果。他们证明了在同一时间不同照明的条件下,同一人的所有图像在图像空间中形成了凸锥,这就是光照锥;布莱兹和维特尔等人提出的在多姿势和多光照的条件下基于3D变形模型(3D Morphable Model)的人脸图像分析和识别方法[12],是这一阶段内一项具有开创性的工作。该方法在CMU-PIE人脸库和FRRET多姿态人脸库上都达到了相当高的识别率;沙苏哈等人在2001年提出了一种基于熵的图像的人脸图像识别和渲染技术[13];康博研究院的维奥拉和琼斯研制了一个基于简单矩阵特征和AdaBoost算法的实时人脸检测系统[14];巴斯里和雅可布提出了基于球面谐波(Spherical Harmonics)模型的人脸识别方法[15]。在FERET项目之后,许多人脸识别商业系统出现了,例如Cognitec,Identix[16]等。在这个阶段,人脸识别得到了更多的发展,人脸识别的在日常生活中的应用逐渐增加,并且依然在不停的进步。

剩余内容已隐藏,请支付后下载全文,论文总字数:31115字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;