目 录
中文摘要............................................................. i
ABSTRACT............................................................ ii
致谢................................................................ iv
目录................................................................ vi
第一章 绪论...................................................... 1
1.1 人脸识别技术研究的背景和意义......................... 1
1.2 人脸识别技术简介..................................... 2
1.2.1 人脸识别的研究范围 ............................... 2
1.2.2 主要的人脸识别技术 ............................... 2
1.3 人脸识别系统的构成................................... 4
1.4 论文內容概述......................................... 4
第二章 人脸位置矫正算法.......................................... 5
2.1 人脸位置矫正问题的引入.............................. 5
2.2 算法的设计思路....................................... 6
2.3 算法的基本实现步骤................................... 6
2.4 算法参数设计和算法基本实现步骤的清晰化............... 6
2.4.1 垂直方差投影 ..................................... 6
2.4.2 水平积分投影 ..................................... 7
2.4.3 图像块纵向复杂度 ................................. 7
2.4.4 眼睛黑斑模型 ..................................... 7
2.5 基于眼睛定位的人脸位置矫正算法....................... 8
2.5.1 灰度人脸区域(人眼搜索区域)的确定 ............... 8
2.5.2 人眼位置的确定 .................................. 10
2.5.2.1 搜索复杂度最大的图像块 ..................... 10
2.5.2.2 利用人眼黑斑模型精确定位人眼 ............... 11
2.5.3 依据人脸图像的轴对称性矫正人脸位置 .............. 12
2.6 算法实验结果分析.................................... 13
2.7 结论................................................ 14
第三章 人脸特征提取与识别算法................................... 15
3.1 特征提取需遵循的原则............................... 15
3.2 主元分析算法....................................... 15
3.3 人工神经网络简介及BP神经网络训练算法的数学描述..... 16
3.3.1 人工神经网络及其特性介绍........................ 16
3.3.2 BP神经网络训练算法的数学描述................... 17
3.4 基于神经网络的主元分析人脸识别方法.................. 19
3.4.1 利用非线性神经网络提取主元特征.................. 20
3.4.2 特征数据的归一化和BP神经网络识别................. 2
3.5 算法实验结果及分析.................................. 22
3.6 总结................................................ 22
第四章 人脸识别系统结构......................................... 23
4.1 人脸识别系统的目标................................. 23
4. 2 本文的人脸识别系统结构........................... 23
第五章 总结与展望............................................... 24
5.1 本文完成的工作..................................... 24
5.2 目前系统存在的不足之处............................. 24
5.3 目前系统改进计划和今后努力方向..................... 24
参考文献............................................................ 25
附录A 毕业设计期间发表论文..................................... 26
附录B 人脸识别系统(软件)使用说明书
第一章 绪论
网络信息化时代的一大特征就是身份的数字化和隐性化,如何准确鉴定一个人的身份,保
护信息安全是当今信息化时代必须解决的一个关键社会问题。正在悄然兴起的人脸识别技术正好可以解决这一问题。
人脸识别技术是最近20年在全球范围内迅速发展起来的计算机安全技术,是人体生物特征识别技术的一种。它根据人脸固有的生物特征信息,利用图像处理和模式识别技术对个人身份进行鉴定。
1.1人脸识别技术研究的背景和意义
鉴别人的身份是一个非常困难的问题,传统的身份鉴别方法把这个问题转化为鉴别一些标识个人身份的事物,这包括两个方面:①身份标识物品,比如钥匙、证件、ATM卡等;②身份标识知识,比如用户名和密码。在一些安全性要求严格的系统中,可以将这两者结合起来,比如ATM机要求用户同时提供ATM卡和密码。这些传统的身份鉴别方法存在明显的缺点:个人拥有的物品容易丢失或被伪造,个人的密码容易遗忘或记错。更为严重的是这些系统无法区分真正的拥有者和取得身份标识物的冒充者,一旦他人获得了这些身份标识事物,就可以拥有相同
的权力。
与传统的身份鉴定手段相比,基于人脸生物特征信息的身份鉴定技术具有以下优点:
● 用户易接受:简单易用,对用户无特殊要求。
● 防伪性能好:不易伪造或被盗。
● “随身携带”:不用担心遗漏或丢失,随时随地可用。
除此之外,人脸识别技术还有主动性好,精确性高,性能/成本比高,自学习功能强等优点。
鉴于人脸识别技术在个人身份鉴定方面的众多优点,这项技术可以在很多领域得到应用:
● 国家安全领域。协助公安,海关等国家安全机构加强对可疑人物、罪犯、恐怖分子的
追踪、监控和识别。
● 公众安全领域。加强交通管制;确认身份证、护照等证件的真伪;验证各类信用卡的持卡人身份。
●计算机交互领域。根据计算机使用者人脸特征确定身份,提供个性化服务。
●家庭娱乐领域等等。
人脸识别技术在这些领域的充分利用,对于有效地鉴定个人的身份,防止犯罪和诈骗、提高办公效率、节约资源有着重大的社会和经济意义。
1.2 人脸识别技术简介, SPAN>
1.2.1 人脸识别的研究范围
“人脸识别(Face Recognition)”的研究范围广义上讲大致包括以下5个方面的内容
(1) 人脸检测(Face Detection):即从各种不同的背景条件下检测出人脸的存在并确定其位
置.这一任务主要受光照、噪声、面部倾斜度以及各种各样遮挡的影响.
(2) 人脸表征(Face Representation):即采取某种表示方式表示检测出的人脸和数据的已知
人脸.通常的表示法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵特征矢量)、
固定特征模板、特征脸、云纹图等.
(3) 人脸鉴别(Face Identification)(通常所说的“人脸识别”):即将待识别的人脸与数据库中的已知人脸比较,得出相关信息.这一过程的核心是选择适当的人脸的表征方式与匹配策略,系统的构造与人脸的表征方式密切相关.
(4) 表情/姿态分析(Expression/Gesture Analysis):即对待识别人脸的表情或姿态信息进行分析,并对其加以归类.
(5) 生理分类(Physical Classification):即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息。
从人的角度来看,他们之间并没有一个十分清晰和绝对的界限,实现其中之一往往也就同时实现了其他方面,他们之间存在着相互依赖的关系。不过,为了便于计算机自动处理,我们还是将整个人脸识别研究的范围理解划分成以上5个部分。
1.2.2 主要的人脸识别技术
通常,人类进行人脸识别依靠的感觉器官包括视觉,听觉,嗅觉,触觉等,一般人脸的识别可以用单个感官完成,也可以是多感官相配合来存储和检索人脸,而计算机的人脸识别所利用的则主要是视觉数据 ——人脸图像。
人脸识别的输入图象通常有3种情况:正面、倾斜、侧面。但由于实际情况的要求,人们对人脸识别技术的研究以正面模式居多,它的发展大致经历三个阶段:人工识别阶段(识别过程完全依赖于操作人员),人机交互式识别阶段,机器自动识别阶段。
近十余年来,随着高速度高性能计算机的发展,人脸模式识别技术有了较大的突破,提出了多种机器全自动识别系统。根据人脸表征方式的不同,我们通常将人脸正面自动模式识别技术分成三类 :基于几何特征的识别方法、基于代数特征的识别方法和基于连接机制的识别方法。(1)基于几何特征的人脸识别方法
这类识别法将人脸用一个几何特征矢量表示,用模式识别中层次聚类的思想设计分类器达到识别目的.这就要求选取的几何特征矢量具有一定的独特性,能够反映不同人脸之间的差别,同时又具有一定的弹性,以消除时间跨度、光照等的影响.几何特征矢量是以人脸器官的形状和几何关系为基础的特征矢量,其分量通常包括人脸指定两点间的欧氏距离、曲率、角度等.例如,Poggio和Brunelli用改进的积分投影法提取出用欧氏距离表征的35维人脸特征矢量用于模式分类。这种方法是比较直观的,侧重于人脸面部器官的轮廓和特征点的寻找,还需利用人脸结构的先验知识(人脸器官的几何位置,形状特征等),达到了一定的识别效果。但这种方法往往是以少数特征点代替整个人脸二维图像,忽略了人脸器官和其他部位上的纹理信息。
(2)基于代数特征的人脸正面自动识别方法
这类识别法仍然是将人脸用特征矢量表示,只不过用的是代数特征矢量:即人脸图象在由
“特征脸”张成的降维子空间上的投影。Sirovich和Kirby 首先将K-L变换用于人脸图象的最优表示.Turk和Pentland 进一步提出了“特征脸”方法,该方法以训练样本集的总体散布矩阵为产生矩阵,经K-L变换后得到相应的一组特征矢量,称作“特征脸”。这样,就产生了一个由“特征脸”矢量张成的子空间,每一幅人脸图像向其投影都可以获得一组坐标系数,这组坐标系数表明了人脸在子空间中的位置,实验表明其具有较强的稳定性,可以作为人脸识别的依据。但研究表明,特征脸的方法随着光线、角度及人脸的尺寸等因素的引入,识别率急剧下降。虽然可通过采用同一人的训练样本的平均来计算类间散布矩阵,但也只能在一定程度上纠正这个缺点。由于对KL变换而言,外在因素带来的图象差异和人脸本身带来的差异是不加任何区分的,因此,不管如何选择正交基,也不能根本解决问题。其改善的一个思路是针对干扰所在,对输入图象作规范化处理,其中包括将输入图的均值方差归一化、人脸尺寸归一化等。此外,由于提取人脸特征时要用到一些复杂的代数运算,此方法运算量较大,不太适合实时性要求较高的场合。
(3)基于连接机制(神经网络)的人脸正面自动识别方法
这类识别法将人脸直接用灰度图(二维矩阵)表征,利用了神经网络的学习能力及分类能力。这种方法的优势在于保存了人脸图象中的材质信息及细微的形状信息,同时避免了较为复杂的特征提取工作。而且,由于图象被整体输入,符合心理学中对人类识别能力的解释。但同时也由于图像被整体输入,存在着输入结点过高的问题,由此引发了网络训练时间长,计算量大,不利于人工神经网络收敛等问题。改善的方法之一就是在不影响网络分类识别能力的基础上,采取一定的措施对输入图像进行降维处理。
当然,还有一种常见的观点 是将人脸识技术分为基于整体人脸特征的识别技术(特征脸方法和神经网络方法)和基于人脸组成部件(眼睛等)特征的识别技术.
1.3 人脸识别系统的构成
人脸识别系统包括 两个主要技术环节(如图1-1所示):首先是人脸的检测和定位,即从输入图像中找到人脸及人脸存在的位置,并将人脸从背景中分割出来,然后才是对归一化的人脸图像进行特征提取与识别。这里需要说明的一点就是,人脸位置矫正也属于人脸检测定位的范畴,并对后续的人脸特征提取和识别具有积极影响。
图1-1:人脸识别系统的基本结构
1.4 论文内容概述
本文对人脸识别算法的研究主要集中在以下两个方面:①人脸位置矫正算法;②人脸特征提取和识别算法。以这两个算法的设计与实现为中心,论文的内容作了如下安排:第1章 是对人脸识别的研究意义和人脸识别技术、人脸识别系统等背景知识的介绍。第2章借鉴了文献[7]的想法,设计并实现了一种新的基于眼睛定位的人脸位置矫正算法。第3章 提出了利用主元分析法和BP神经网络实现的人脸特征提取与识别算法。第4章 提出了基于第2,3章算法的人脸识别系统结构。第5章是对本文的总结与展望。
第二章 人脸位置矫正算法
本章针对大部分人脸识别系统建模中存在的不足,将人脸位置矫正问题引入思考,并根据人脸图像特点设计实现了一种新的基于眼睛定位的人脸位置矫正算法。(为方便叙述起见,我们称人脸在竖直平面内的倾斜角度为平面旋转角度,而称人脸在水平面内的倾斜角度为深度旋转角度。本文中出现的人脸位置矫正说法都是针对平面旋转角度而言的。)
2.1 人脸位置矫正问题的引入
作为人类智能的重要体现和个人身份鉴定的重要手段,人脸识别技术具有广泛的应用前景,已成为一项热门研究课题。人脸识别的关键技术之一就是人脸的检测定位。在一个完整的人脸识别系统中,能否对人脸进行正确的检测定位将对整个人脸识别系统的性能优劣产生极其重要的影响,而影响人脸检测定位的一个重要因素就是人脸在图像中的姿势。
实际中,由于受到人的行为习惯,生理特征以及图像采集环境等诸多因素的影响,人脸在采集到的人脸图像中的姿势往往并不是完全正立的,而是在水平和竖直平面内都存在一定的倾斜角度(即深度旋转角度和平面旋转角度)。但是大部分的人脸识别系统都是针对正立的正面人脸图像而设计的 ,没有考虑到人脸图像可能存在的倾斜问题,致使这些人脸识别系统从人脸倾斜的图像中提取的特征数据在一定程度上失效,并有可能进一步导致人脸识别系统在最终识别结果中产生误判。
针对这一情况,我们可以采取两种措施加以解决。其一,研究新的适用于非完全正立人脸图像的特征检测方法并对人脸特征的提取作相应的调整,这种解决方法在文献[9]已有所尝试;其二,沿用现有的人脸识别系统,但在人脸图像送识别系统进行特征提取和识别之前(即在人脸检测和定位阶段),先进行人脸位置矫正的工作,这种方法在文献[10]中也已有所研究,并取得了较好的效果。