基于级联回归的实时移动端人脸配准方法

 2022-01-17 11:01

论文总字数:19718字

目 录

1 绪论 1

1.1 人脸配准的背景 1

1.2 人脸配准的国内外现状 1

1.3 人脸配准的应用领域 2

1.4 研究内容与结构安排 3

2 人脸配准算法基础 3

2.1基于模型的人脸配准 3

2.2基于回归的人脸配准 4

3 显式形状回归的人脸配准 4

3.1 级联形状回归 5

3.2 人脸配准算法 5

3.2.1 人脸配准框架 5

3.2.2 形状索引特征 6

3.2.3 两级的级联回归 7

3.3 实验 9

3.3.1 参数设置 9

3.3.2 实现细节 10

3.3.3 实验结果 10

4 安卓移动端人脸配准系统 11

4.1 开发平台介绍 11

4.1.1 OpenCV(Open Source Computer Vision Library) 11

4.1.2 Android 12

4.2 安卓端人脸配准的实现 13

4.2.1 安卓端配准的算法流程 14

4.2.2 人脸检测 15

4.2.3 对检测到的人脸进行配准 16

4.3 人脸配准实现过程中的困难 16

4.3.1 人脸数据库的选择 16

4.3.2 Visual Studio和OpenCV环境配置问题 16

4.3.3 Android开发不熟悉 17

4.3.4 其它一些问题 17

4.4 移动端的测试结果 17

5 总结和展望 18

(1)总结 18

(2)展望 18

参考文献 20

致谢 22

基于级联回归的实时移动端人脸配准

王善敏

,China

Abstract: We study a very efficient, “Explicit Shape Regression” approach for face alignment. Unlike previous regression-based approaches, we directly learn a vectorial regression function to infer the whole facial shape (a set of facial landmarks) from the image and explicitly minimize the alignment errors over the training data. The inherent shape constraint is naturally encoded implied from coarse to fine during the test, without using a fixed parametric shape model as in most previous methods.

To make the regression more effective, we use a two-level boosted regression as the framework. Shape-indexed features and correlation-based feature selection method greatly reduce the feature selection time. This combination enables us to learn accurate models from large training data in short time and run regression extremely fast in test. Furthermore, we implement this method in Android. Eclipse realizes the collection and display of face image and Visual Studio realizes the detection and alignment. C and Java are connected by NDK.

Key words: two-level boosted regression; shape-indexed feature; correlation-based feature selection method; Android

1 绪论

随着计算机领域的迅速发展,机器视觉作为计算机学科的一个分支,也随之迅速兴起,从传统二维图像的模式识别到三维图像的机器视觉,该领域掀起了全球性的研究热潮,相关产业也蓬勃发展。人脸识别作为机器学习领域最具有挑战性的课题之一,吸引了众多研究者的关注。人脸配准作为人脸识别的关键步骤,配准的速度和精度直接影响着人脸识别的成功率,所以人脸配准是人脸识别的前提和基础。智能手机的普及也使得人脸配准的应用更加广泛。

1.1 人脸配准的背景

人脸配准是一种图像预处理的方法,主要应用于人脸识别、表情分析、年龄估计等方面。人脸配准将图像的旋转、平移等变化消除、减少这些因素的干扰,从而较为准确的定位出人脸关键点的位置,方便之后的人脸校验和人脸识别的相关工作。

1.2 人脸配准的国内外现状

人脸配准的相关工作兴起于上个世纪七十年代,当时的主要研究工作是基于人脸的外轮廓。到目前为止,人脸配准主要经历了三个阶段:第一阶段主要研究人脸配准工作所需的面部特征,研究者建立了较高质量的人脸灰度模型,但是这一工作依赖于研究者手动完成,并没有达到自动配准的效果。第二阶段是人机交互的识别模式,研究者用几何参数来刻画人的正脸图像,他们使用多维特征矢量来表示面部特征。这种方法虽然较之之前的工作进步不少,但是仍需利用到操作者的一些经验知识,仍然没有达到完全自动配准的效果。第三阶段是真正的机器自动人脸配准。随着计算机的迅速发展,其在性能和精度方面都有了很大的提高,人脸的相关工作都有了重大的突破,越来越多的研究者提出了高效的配准方法,人脸的相关技术也达到了实用的效果。

人脸配准的相关工作最早兴起于国外,西方的一些研究者们就这一相关工作进行了大量的实验研究,也逐步提出较为合理的配准方法。因此,西方国家在人脸的相关领域一直处于比较领先的地位。目前,大部分的研究工作主要是在已有合理算法的基础上优化算法的结构和性能,提高配准的精度。

国内由于一些社会原因,导致人脸配准领域兴起较晚。虽然较之西方国家人脸配准行业在国内起步较晚,但是研究人员长期不懈努力,已经积累了丰富而宝贵的经验,在该领域已经取得了较好的成就。这些研究人员大都来自一些高校和研究所,他们在国内外著名的期刊杂志上刊登了大量的人脸识别相关领域的文章,并被多次引用。部分研究已经被转换化为现实。

1.3 人脸配准的应用领域

人脸配准的初始是由算法实现人脸检测,定位出人脸的位置,再在此基础上根据人脸的纹理信息和关键点之间的坐标约束实现人脸关键点的定位和跟踪,如今,人脸配准已经有很多应用,如:人脸识别、表情分析、年龄估计等。

图1.1 人脸配准的应用领域

(1)人脸识别

人脸识别主要应用于人物的身份识别。二十世纪九十年代,安防领域引进了监视器,到了今天,监视器已经“无所不在”。但是如果依靠人去识别监控视频中的人物,这个不仅工作量大,而且繁琐。如何快速识别出视频中远景人物的身份,且这种情况下的人物还处于不配合状态,这对于监控视频的应用程序提出了新的要求。毋庸置疑,人脸识别技术能够解决这个问题。通过实时检测视频中出现的人物,采集视频中的人脸数据,然后将采集到的数据与已有的人脸数据库进行对比,从而确定人物的身份。

人脸识别及其衍生产品如今已经应用十分广泛,在金融、司法、军队、边检、电力、航天、工厂、教育、医疗等领域均有涉及。当然,随着科学技术的发展,人脸识别的技术也会越来越成熟,人脸识别将会应用到更多的领域。

(2)表情分析

人脸的面部表情可以表达一系列的信息,在人与人的交流中起着非常关键的作用。随着计算机技术的飞速发展,人们越来越希望计算机实现越来越多与人相似的功能,甚至渴望未来能够实现计算机能够与人交流。所以计算机实现表情分析的功能就是非常有必要的。

虽然大部分人对于计算机能够识别人面部的表情保持怀疑态度,但是实验表明:识别系统不仅能够识别出那些虚情假意的表情,还能够捕捉到那些一闪而逝、难以捕捉的真实表情。表情分析系统需要事先输入一个观测者的原始面部图像,然后判断观测者的表情。表情分析的应用前景十分广泛。

(3)年龄估计

年龄是人很重要的一个属性,自动的年龄估计近年来成为机器学习等领域一个热门的话题,应用也十分广泛,如法医学、电子商务、安全控制等领域。人们可以通过一个人的人脸和声音来判断一个人的年龄,原因在于人脸和语音是人年龄的重要判断依据,那么计算机也可以通过人脸和语音来进行年龄估计。

1.4 研究内容与结构安排

本课题主要研究了在移动端(安卓)的人脸配准。在Eclipse平台以Java语言编程实现安卓项目和基础的人机交互,核心算法如特征提取、人脸配准等均是以C/C 语言在Visual Studio上实现。

并通过NDK实现Java和C 的连接。

本文分为以下五个部分:

(1)绪论。介绍论文研究的背景,国内外现状,应用领域。

(2)人脸配准算法研究的基础。主要介绍之前的一些算法,分析它们的优点和不足。

(3)人脸配准。提出本文所用的人脸配准的算法以及算法的理论基础。

(4)移动端(安卓)的人脸配准。对Android、开发工具和环境的介绍。

(5)总结和展望。总结本次课题的优点和不足。

2 人脸配准算法基础

在过去数十年内,统计变形模型已经作为一个重要的研究领域出现,存在于计算机视觉、统计模式识别和机器学习领域的交叉处。统计变形模型旨在定位基准点方面解决配准问题。尽管统计变形模型能建立很多物体的分类,但是目前的主要工作是用于解决人脸配准问题。现在最普遍使用和被很好学习的人脸配准方法能够被分成两大类:一类是以级联方式使用回归的判别性模型,另一类是迭代优化的生成模型。

2.1基于模型的人脸配准

基于模型的方法旨在对人脸进行建模,求出模型的参数即可合成对应的人脸图像。到目前为止,生成模型类具有代表性的算法是Cootes分别于1992年和1998年提出的主动形状模型(ASM)和主动外观模型(AAM)。主动形状模型(ASM)构建各个特征点的局部特征,此方法对噪声比较敏感且只对人脸进行了形状的约束。主动外观模型(AAM)在主动形状模型的基础上加上了人脸纹理的信息分析,纹理信息的加入增加了计算时间,需要在特征提取的时候对高维的数据计算进行优化,解决方法是预测出纹理变化需要的模型,对模型的参数进行调整。但是这两种方法对初始化都比较敏感,对于外观的变化的适应性较差。这两种方法均使用了参数形状模型。虽然参数形状模型是主流,但是其有一定的缺点:(1)参数误差不等于配准误差,最小化参数误差是次优的;(2)模型缺乏灵活性,如PCA方法的维度不能改变,所以对于人脸配准不能细微调整。

2.2基于回归的人脸配准

基于回归的这种方法旨在把物体的外观直接映射到回归函数的输出变量(不管是关键点的坐标还是回归模型的参数)。尽管为了解决人脸配准问题使用线性回归的历史跨越了很久,由于训练精确回归函数的有力数据的缺失,研究团队们还是转向了其它代替性的方法。然而由于手工标注关键点的人脸数据的丰富,基于回归的人脸配准方法在该领域内又流行起来。最近的研究工作表明使用一个级联的回归函数可以取得很好的配准效果。根据使用的回归函数的性质,基于回归的模型可以大致被分成两类:一类是使用线性的回归方法,例如监督下降法(SDM),这种方法倾向于使用强大的手工标注的关键点。另一类是使用非线性的回归方法。线性回归方法的代表是在CVPR10提出的级联的姿态回归(CPR),配准框架如图2.1所示:

剩余内容已隐藏,请支付后下载全文,论文总字数:19718字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;