基于神经网络的人脸识别算法研究
姓名:袁崇涛申请学位级别:硕士专业:信号与信息处理指导教师:郭成安
20061219
大连理工大学硕士学位论文摘要人脸识别技术作为图像处理和模式识别的最重要的应用之一,正逐渐成为热门的研究课题.它在公安,银行及海关等机要部门有着广泛的应用前景。人脸识别问题涵盖了图像处理、模式识别和计算机视觉等多个领域,它主要有两个部分:特征提取和模式识别部分。特征提取识从人脸图像中提取可以用来分类的信息;而模式识别部分是利用提取的特征进行模式分类。对于特征提取部分,本文中采用的是基于统计的特征,分别是基于KL变换(KLaO或主成分分析(PEA)的特征脸方法和基于线性判别分析(LDA)的Fisher脸方法。对于模式识别部分,首先采用了纠错支持向量机(SVM)方法和超椭球神经网络方法,其中纠错SVM方法有着较高的正确识别率;而超椭球神经网络方法是仿生(拓扑)模式识别理论的一个应用形式,它对未训练样本有着较低的错误接受率。基于以上两点,本文提出了一种二次分类方法。它将基于仿生模式识别理论的超椭球神经网络方法与具有纠错能力的SVM方法结合起来,首先使用超椭球神经网络进行第一次分类得到中间结果,将全体训练样本和中间结果放入具有纠错能力的SVM中进行二次分类。这种方法兼具仿生模式识别和纠错SVM的优点,并可以克服对未训练样本的误识率高的问题,同时也具备纠错SVM方法的纠错能力,因而具有比以上两者更好的分类效果。在CambridgeORL人脸库的仿真实验结果表明,以Fisher脸特征为输入矢量,应用二次分类方法进行图像识别,正确识别率达到了99.25%。关键词:纠错s州;超椭球神经网络;二次分类方法大连理1:大学硕士学位论文ResearchonAlgorithmsofFaceRecognitionBasedNeuralNetworkonAbstractAsoneofthemostimportantapplicationsofimageprocessingandpaRemrecognition,researchinfacerecognitionhavebeenincreasedsignificantlyareinmanyfields.Manysubjectssuchasimageprocessing,patternrecognitionandcomputervisionareincludedintheproblemsofpatternrecognition.Theretwopartsofthefacerecognitiontoextractusefulsystem:featureextractionandpatteminformationforclassificationfromfeaturesthatextracted.recognition.Featureextractionisfaceimages;whilepatternrecognitionusedKListoclassifytheForthefeatureextractionpart,themethodfeatures.TheyareinthisthesisisbasedonstatisticaleigenfacemethodbasedFisherfacemethodbasedonTransfoHntheorPrincipalComponentAnalysis(PCA)andonLinearDiscriminantAnalysis(LDA).areForthepatternrecognitionpart.themethodsusedandtheHyper-EllipsoidNeuralhasaSVM’SwithwitIlerrorcorrectionNetwork(HENN).TheSVM’Srecognitiontheory,whichhaserrorcorrectionmethodhighcorrectrecognitionrate;whiletheHENNmethodisaoneoftheapplicationsofbiomimetic(topological)patternrate.Basedmethod.oneverylowfalserecognitionathetwopointsmentionedabove,thispaperpresentstwo-passclassificationItcombinestheHENNmethodbasedtheSVMmethodwit}lgettheintermediateintermediateresulterroronthebiomimeticpatternrecognitiontheoryandcorrectionability.TheHENNisusedforthefirstclassificationtotheSVMwitherrorresult,andcorrectionmethodisusedtosolvethesecondclassification.IthastheandallthetrainingsamplesfortheadvantagesofbothbiomimeticpatternrecognRionthatitmethodandtheSVMmethodwi也errorcorrectionability,thefirstisCanavoidthehighfalserecognitionrate,andthesecondisthatiShastheerrorcorrectionability.SOitoutperformseitherofthetwomethods.SimulinkexperimentsonCambridge0RLdatabaseshowsthatwiththeFisherfacefeaturesthetwo-passclassificationmethod,thecorrectrecognitionratehasreached99.25%forimagerecognition.KeyWords:。SVM’Switherrorcorrection;Hyper-EllipsoidNeuralNetwork;Two-passClassificationMethod独创性说明作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。作者签名:重掌夤日期:兰堑/口大连理工大学硕士研究生学位论文大连理工大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。作者签名袁襞有导师签名:奶水移矽,/年,z月/D日大连理工大学硕士学位论文1绪论1.1研究背景及意义在现代社会中,身份鉴定技术具有非常重要的应用价值。随着网络技术的发展,信息安全也显示出前所未有的重要性,对个人身份鉴别的需求可以说无处不在。如某人是否有权进入安全区域(安全系统),是否有权进行特定交易,是否是本国居民等等,都需要精确的身份鉴定“一.当前,用于个人身份鉴别主要依靠D卡(如身份证、工作证和储蓄卡等)和密码等手段,然而这些手段存在携带不便、容易遗失、或者由于使用过多或不当而损坏、不可读和密码易被破解等诸多问题,犯罪分子伪造假证件的手段也越来越高明。因此,目前广泛使用的依靠证件、个入识别号码(PIN-PersonalIdentificationNumber)、口令或钥匙等传统方法来确认个人身份的技术面临着严峻的挑战,并显得越来越不适应现代科技的发展和社会的进步,人们希望有一种更加可靠的办法来进行身份鉴定。生物识别技术提供了一种基于惟一的、高可靠性和稳定性的人体生物特征的新的身份鉴别途径,基于人体生物特征识别技术的个人身份鉴别系统,由于使用了人体本身所固有的生物特征,如指纹、虹膜、掌纹、人脸等的特征,因此具有更好的安全性、可靠性和有效性。相对于其他生物特征识别技术,人脸识别技术具有特征录入较为方便、信息丰富、适用范围广等优点.另外,人脸识别的研究还涉及图像分析与处理、模式识别、人工智能、计算机视觉、心理学、生理学等多个学科领域,更是模式识别、人工智能和计算机视觉的典型案例之一。对这一问题的研究和解决,有助于对其他对象识别问题的研究分析和解决,人脸识别也因此成为这些基础研究领域的重要课题之一,具有重要的理论研究价值和广阔的应用前景“1。虽然人脸识别有着广泛的应用前景,但是人脸识别技术的研究仍存在着很多的困难。其中来源于人脸自身的变化和成像条件的影响对人脸的识别造成了非常大的麻烦。人脸自身的变化:人脸是一个弹性体,人脸的表情变化对图像有非常大的影响;人脸可以随时问变化,比如人脸的胖瘦,人脸的脸色,化妆,甚至是整容,另外人脸随年龄的变化也是一个不得不考虑的问题。成像条件的影响;成像时的光照条件,光照角度:成像时的镜头角度,镜头距离;成像时人的头部旋转角度等等。人脸识别还涉及到了数字图像处理,模式识别,计算机视觉,神经网络等众多学科.所有这些都给计算机人脸识别技术带来了非常大的挑战。基于神经网络的人脸识别算法研究1.2人脸识别技术的发展及研究现状早在上世纪六、七十年代,人脸识别技术就引起了研究者的浓厚兴趣;进入九十年代之后,由于高速度高性能的计算机的出现,人脸识别技术取得了重大进展。而自美国发生“9.1l”事件以后,人脸识别在信息安全领域的作用逐渐显现出来,人脸识别技术得到了前所未有的重视嘲。国内外对于人脸识别的研究发展,技术趋势分别经历了三个阶段01:机械式的识别阶段、机器自动识别初级阶段、机器自动识别高级阶段。第一阶段为机械式的识别阶段,是以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征。该阶段的识别依赖于人的操作,需要利用操作员的某些先验知识来进行。在BertilIon的系统中,用一个简单的语句与数据库中某一张脸相联系,同时与指纹分析相结合,提供了一个较强的识别系统;为了提高识别率,Allen“”为待识别脸设计了一种有效和逼真的摹写;Parke“21则用计算机实现了这一想法,并产生了较高质量的人脸灰度图模型。这一阶段工作的特点是识别过程全部依赖于操作人员,显然这不是一种可以完成自动识别的系统。第二阶段为人机交互式初级阶段,主要是采用机器自动识别的手段进行识别。代表性工作有:Goldstion,Harmon和Lesk用几何特征参数来表示人脸正面图像Ⅲ,他们采用2l维特征向量表示人脸面部特征,并设计了基于这一特征表示法的识别系统;Kaya和离,嘴唇的高度等;更进一步地,T.Kamd(M.Nagao)01设计了一个高速且有一定知识导引的半自动回溯识别系统,创造性地运用积分投影法从单幅图像上计算出一组脸部特征是一个很大的进步。这个阶段需要利用操作员的某些先验知识,仍然摆脱不了人的干预。第三阶段为机器自动识别高级阶段,是真正向实用化发展的机器识别阶段,这一阶发展,人们己提出了许多成熟、高效的方法,很多产品已用于实际应用。目前世界上的商用识别系统主要有Identix(原Visionics)公司的“FaceIt”系统,Viisage公司的“FacelD”系统,Cognitec公司的“FaeeVACS”系统以及HumanScan公司的“BioID”系统等。1.3人脸识别方法综述一个完整的人脸识别系统的组成如下图所示:2Kobayashi则采用了统计识别方法,用欧氏距离来表征人脸特征,如嘴唇与鼻之间的距参数,再利用模式分类技术与标准人脸相匹配,Kanad的系统实现了快速、实时的处理,段识别率和自动化程度得到了提高。随着计算机的大型化、高速化和人脸识别的方法的大连理工大学硕士学位论文黼刮人戮测吲嬲吲絮吲训练像库图像——1与定位广—1预处理广—1与选择广—1图1.1人脸识别系统的框图Fig.1.1Thecomponerasofthefacerecognitionsystem…’”一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一汤涵I-一丁『如图1.1所示,一个完整的人脸识别系统由下列部分组成:(1)图像的获取:从外界获取作为人脸识别系统输入的人脸图像,本文所用图像为CambridgeORL人脸库图像;(2)人脸的检测与定位:判断图像中是否存在人脸,如果有则找到其所在位置,并将其从背景图像中分离出来。本文所采用的人脸图像均为经过检测与分离后的人脸图像,因此本文并不涉及此内容;蒲(3)lift像预处理:对图像进行平滑、去噪、归一化等处理,减少光照、成像条件、外部环境等意外因素对图像的干扰,为后续工作提供高质量的图像,本文所进行的研究并未对图像进行预处理;(4)特征的提取和选择:它的目的有两个,一是减少图像的计算和存储,一幅92x112的人脸灰度图像,共有10304个数据元素,直接存储会占有大量空间,而经过特征提取和选择后,存储量仅为直接存储的几百分之一左右;二是原始图像中的部分象素信息对于人脸分类并没有太大贡献,经过特征提取和选择后的人脸特征信息可以提高分类速度和识别率,因此本过程是人脸识别系统的关键。(5)j/tl练:即分类器的设计,经过训练得到分类器的参数,从而得到分类器。(6)识别:利用训练得到的分类器进行人脸识别,得到识别结果。本文主要研究的是人脸识别系统中的特征提取与选择及分类器的训练与识别部分。人脸识别经过多年的发展已得出很多有效的特征提取与识别的方法。现讨论几种常见的方法:(1)主特征分析(PCA)方法““”。最典型的特征提取方法之一。为了有效的提取人脸图像特征,人们用KL变换进行统计特征提取。KL变换是图像压缩中的一种最优正交变换,同时也是子空间法模式识别的基础。将PCA方法用于人脸识别,其实是假设所有的人脸都处于一个低维线性空间,而且不同的人脸在这个空间中具有可分性。由于高维图像空间经过KL变换后可得到一组新的正交基,对这些正交基作一定的取舍,保留其中基于神经网络的人脸识别算法研究的能量最大一部分生成低维的人脸空问,即人脸的特征子空间.将人脸图像向这个子空间上投影,可以得到一组特征系数,以此作为人脸识别的特征向量,作为分类器的输入。(2)Fisher脸方法“‘”“。KL变换只是一种数据处理方法,它具有最佳的图像表示能力,但并不意味着它具有最佳识别能力。Fisher线性判别旨在求出一个最佳鉴别向量,将原来高维的模式样本投影到最佳鉴别向量空间以达到减小特征空间维数的目的。Fisher最佳鉴别向量方法的目的是使投影后的模式样本空间类问散布矩阵最大而类内散布矩阵最小,也就是保证了投影后的模式样本在新的子空间有最大的类间距离与类内距离之比,从而使各模式在该空间有最佳的可分性。(3)基于神经网络的方法咖。这是近些年来比较活跃的一个研究方向,它既可以用于特征提取,也可以用于模式识别。神经网络方法在人脸识别上比其它类别的方法有独到的优势,它具有良好的自学习、自适应能力,特别是它的自学习能力在模式识别方面表现尤为突出汹1。神经网络方法可以通过学习的过程获得其它方法难以实现的关于人脸识别规律和规则的隐性表达。但该方法可能存在训练时间长、收敛速度慢的缺点。(4)基于支持向量机(Sv ̄D的方法吼矧。近年来提出的一种分类方法,该方法的理论基础是神经网络。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂度和学习能力之间寻求最佳折衷,以期获得最好的推广能力。从理论上说,该算法得到的是全局最优解,解决了神经网络方法中的局部极值问题。此外,该算法将实际问题通过非线性变换转换到高维特征空间,在高维特征空间构造线性判别函数来实现原空间中的非线性判别函数,同时它解决了维数问题,其算法复杂度与样本维数无关。(5)基于仿生模式识别理论的方法‘8州。传统模式识别中把不同类样本在特征空间中的最佳划分作为目标,而仿生模式识别则以一类样本在特征空间中分布的最佳覆盖作为目标㈨。也就是说,在仿生模式识别理论中,每一种类型样本子空间的构造是仅仅依赖于该样本类型本身,这与传统模式识别中依赖各种类型样本之间的关系构造样本子空间是完全不相同的。仿生模式识别理论利用“高维空间集合形体覆盖识别方法”进行该类型子空间的构造。基于仿生模式识别理论的识别方法避免了对于未训练样本的误识率较高的问题。1.4本论文的主要工作和章节安排本文重点对人脸的特征提取和分类器的设计进行研究。首先实现了主成分分析(PCA)、Fisher判别准则(FLD)在人脸识别中的应用。4大连理工大学硕士学位论文本文的主要工作是分类器的设计,首先采用了具有纠错能力的SVM算法‰删和超椭球神经网络方法。其中具有纠错能力的SVM算法由于利用了信道差错控制的编码技术而具有纠错能力,从而得到较高的正确识别率;而超椭球神经网络方法是仿生模式识别理论的应用,它对未训练样本有着较低的错误接受率.鉴于以上两点,本文提出了一种基于超椭球神经网络和纠错支持向量机(SVM)的二次分类方法,它既具备了仿生模式识别的对未训练样本误识率低的特点,又具备了纠错SVM的具有纠错能力的特点,取得了较好的识别效果。本文共分五章,其内容如下:第一章是绪论部分,阐述了人脸识别问题的提出、发展、研究现状,人脸识别现有的特征提取与识别的主要方法以及本文的主要工作和章节安排。第二章讨论了几种典型的人脸识别的特征提取和识别方法,如用于特征提取的主成分分析(PcA)方法和Fisher脸方法,用于模式识别的纠错SVM方法和超椭球神经网络方法。第三章将纠错SVM方法与超椭球神经网络方法结合起来,提出了一种二次分类方法。重第四章给出了以上方法的实验结果与分析。第五章是本文的总结和展望。基于神经网络的人脸识别算法研究2几种典型的人脸识别的特征提取和识别方法人脸识别系统成功的关键在于人脸特征的提取和分类器的设计。特征提取是指从人脸图像中提取出有效信息,将其作为分类器的输入进行分类识别,分为如下两步进行…:首先,原始特征值的形成,由被识别的对象通过计算或者工具测量产生一组特征值。这是由对象本身得来的一组数值,因此一般被统称为原始待征值。其次,人脸特征的提取。特征提取使高维的原始待征向量如,而,…,毛尸通过某种变换,产生低维的特征向量饥,Y2,…,咒}r。所有的人脸图像数据构成高维空间,一幅人脸图像是高维空间的一个点,高维空间的维数通常是非常庞大的,如本文所用的人脸库中图像是10304(112x92)维的。但是其中有些信息并不能揭示人脸的特征,它们的存在可有可无。在这种情况下为了有效地实现分类识别,就要对这些图像数据进行变换,剔除那些冗余的信息,得到最能反映分类本质的特征。特征提取的目的,就是为了降低特征空间的维数并尽可能保留识别信息,以达到有效分类的目的。常用的特征提取方法有主成分分析(PCA)方法、Fisher脸方法,独立分量分析(ICA)方法‘“o以及小波变换方法等。同特征提取一样,分类器的设计同样决定着人脸识别系统的成败。常用的分类方法有最近邻法、神经网络方法,支持向量机方法等。2.1主成分分析主成分分析方法(PrincipleComponentAnalysis,简称PcA),又叫做特征脸方法,它是现代人脸识别方法中最为经典,最常见的一种方法。PCA利用统计方法直接从整个训练图像集中提取统计特征,而不要求单独抽取鼻子,嘴巴,眼睛等五官特征。PCA是一种多元统计数据分析方法,实际上就是进行K-L交换,它是用数量不多的若干个线性无关的变量来描述多维空间的绝大部分信息,是基于目标统计特性的最佳正交变换。经过变换后产生的新的分量正交或者不相关,同时以部分新的分量表示原矢量的均方误差最小。2.1.1离散KL变换离散Karhunen-1..,oeve变换,简称KL变换或主成分分析“”。在图像集合M(m,帕,m=o,l'…,肘一1,n=0,1,…,N一1),O=L2,…,K)中的每一个图像4(m,H)可以表达为MN维的一维向量4:6大连理工大学硕士学位论文4J4=4U,o)4J;,其中屯=4(.,,1)(2.1)4J,.I4U,Ⅳ一1)其中4。,是集合中第l幅图像第-『行元素排成的列向量。A的协方差矩阵定义为:∑。=E{(』一%x彳一%)7,其中%=E{毋是A的平均值向量,占{.)表示求统计平均的运算。对于上述置幅图像的集合可以由下列两式计算:(2.2)r/4A=专∑4(2.3)(2.4)1=1r∑。=专∑(4-uAX.每--UA)T令去掉均值的向量为咒=‘一叱,则去掉均值的人脸矩阵为y=∽,奶,…,咒】。囊它是K幅图像的统计平均值。其中虬是删维的,而∑。是』州维的实对称阵·设口』和丑(i=L2,…,^刃v)是∑。对应的特征向量和特征值。将A按减序排列,使得五2五≥…≥乃“(2.5)而特征向量码是^拼维的。有下列等式成立:∑。q=丑q(i=L2,…,㈣量,构成一个MAr维的完备正交向量系。(2.6)由于爿的协方差矩阵∑。是实对称方阵,一定存在有^刃、r个互为正交的实特征向令K-L变换的变换矩阵为丁,T由∑。的特征向量构成,第f行元素由特征向量口』r构成,即T=联q=佐曷B=T(A一%)(2.7)r为MAr阶正交方阵,则离散K-L变换可以表达为:(2.8)变换后曰的平均值向量‰为:7基于神经网络的人脸识别算法研究而变换后口的协方差矩阵∑。为∑。趣{删一巩x刚一砜)7)==阿E{T陋(A-‰uA炸XA一-如uA))rr)T,z}=2匹{(4一‰)(4一心)1)r1(2.10):ry,‘一^『吖]∑。=r∑。,-I;l∑。hl‰,J…‰】=[三,]匹^…∑。‰卜[三,卜q…‰‰,∞。,一蚓”一曩]:卜%【0…‰j可以看出,经KL变换后B的协方差矩阵∑。是对角阵,∑。非对角线上的元素称为协方差,协方差为0说明B中各元素之间是互不相关的,而∑。中对角线上的元素不为0,说明原始图像中元素的相关性很强,而且口中第f个元素的方差就是∑。的作为一组基表示去掉均值的图像,原图像为y=∑吼q,近似的表示为多=∑吼q,其中8大连理工大学硕士学位论文f=E{【(4一%)一多】【(4一心)一.刃7)∞’=E{(∑:研(芝q,a,X艺㈣r}∑研q)7}、“1‘7l-d“t---d+l由于q相互正交,可以得到孝=E【∑酽),将吼=衫y=口J似一心)代入,可得孝=肼∑d,(A-u,XA-u,)7q}j—甜●I=∑afiE{(A-I/AX彳-uA)7)q(2.13)=∑衫∑。q=∑丑可以看出,利用d个最大的特征值对应的特征向量作为基来表示原来的图像产生的均方误差最小。由以上过程可以得知,KL变换有以下优点:(I)完全去掉了原图像中的相关性;(2)利用d个最大的特征值对应的特征向量作为基来表示原来的图像所产生的均方误差最小;(3)从能量压缩的角度来看,KL交换是最优的。2.1.2离散KL变换在人脸识别中的应用M.Turk提出的特征脸方法“”以训练样本集的总体散布矩阵为生成矩阵,经KL变换后得到一组特征矢量,该矢量具有人脸的形状,又称为“特征脸”㈣。这样,就产生了一个由特征脸矢量张成的子空间,将每一幅待识人脸图像投影到该子空间上可以获得一组坐标系数,这组坐标系数表明了人脸在子空间中的位置。通过将该坐标系数和已知入的人脸系数进行比较就可以得到该人脸的识别结果。在计算生成矩阵的特征值和特征向量时,由于生成矩阵的维数较大,如果直接计算,计算量将是非常巨大的,此时可以通过奇异值分解(SvD)的方法来间接求取,下面给出奇异值分解(SVD)定理咖1。奇异值分解(SVD)定理:设A是一秩为r的nxr维矩阵,则存在两个正交矩阵:u=[Uo,%~ff/rl】∈巩~y=【vo,vl,..v,-l】E婀“7以及对角阵(2.1钔9基于神经网络的人脸识别算法研究A=diag[Ae,^,..4一l】∈孵“’(2.15)且凡≥^≥…≥缸。,满足如下等式:三A--UA2V(2.16)其中4为矩阵见r和A7A的非零特征值,M和B分别为止,和彳■对应于五的特征向量,上述分解即为矩阵A的奇异值分解,所以由上式可以得到:』U=AVA2(2.17)利用主成分分析方法进行人脸识别的主要步骤有:(1)读入人脸库。将每一个二维人脸图像数据转化为一维向量,选取每个人的某些人脸图像作为训练样本集,其余的作为检验样本集。(2)计算生成矩阵,即总体散布矩阵∑。=研似一叱x_一‰)7},也可以写为f∑。=专∑(4-u。X4-uA)7,其中4为第f个训练样本的图像向量,‰为训练样本集1-1的平均图向量,x为训练样本的总数。<3)计算生成矩阵的特征值和特征向量。由于生成矩阵罗.的维数为删×删,而删通常是一个比较大的数,如果直接计算该矩阵的特征值和特征向量,计算量将是非常巨大的,此时应通过奇异值分解(SVD)㈨的方法来间接求取。根据奇异值分解(svo)定理,可以设z=】,,√置,则】,=√置.z,可得∑』=专l矿=ZZ7,∑_为MNxUN维方阵,而∑』‘=z7z为足阶方阵,RK《删,I由SVD定理可得:z=UA2V7,则丑(f=1,2,…,,)为矩阵zZ7与矩阵z7z的非零特征值,l甜,与u分别为矩阵zz7与矩阵z7z对应于丑的特征向量,丽U=ZVA2。可以通过计算I1矩阵z7z的特征向量t,然后根据U=ZVA2,由q=÷匆可以求出ZZ7的特征向量。^可以看出,用这种方法来求取特征值可以大大的减少计算量。(4)人脸特征的提取与识别。虽然协方差矩阵罗。最多有K(K《删)个对应于非零特征值的特征向量,但是通常情况下,K仍然很大。而在实际中,并非所有的特征向量都需要保留,在这种情况下,考虑到KL变换的特点,可以仅仅选取最大的前K个特征值所对应的特征向量玩。lO大连理工大学硕士学位论文而玩的每列(行)也对应于一个图像,它们被称之为特征脸。以这些特征向量玩形成降维子空间,将原来的人脸图像向该子空间投影,可以得到咒=刃@一%),以此作为训练样本的特征向量。同样的,对于检测样本也可以将其向降维子空间内投影,得到可以代表检验样本的特征向量。关于人脸识别的算法,本文将在后面进行详细讨论。2.2Fisher脸方法KL变换只是一种数据处理方法,它具有最佳的图像表示能力,但并不意味着它具有最佳识别能力。而Fisher最佳鉴别向量方法的基本思想是将原来高维的模式样本投影到最佳鉴别向量空间中以达到减少特征空间维数的目的。Fisher最佳鉴别向量方法使投影后的样本的类间散布矩阵最大而类内散布矩阵最小,也就是说投影后保证样本在新的子空间中有最大的类间距离和最小的类内距离,从而使样本在该空间中有最佳的可分离性,因此它是一种有效的模式分析技术,关键是如何求解最佳鉴别向量。J.W.Sammon…提出了求最佳鉴别平面的技术。D.H.Foley与J.W.Sammon㈨进一步求出了最佳鉴别向量集。文献[14]和[45]提出通过使用Fisher线性判别(FLD)来减少特征空间维数的新方法。FLD利用了类成员信息并抽取了一个特征向量集,该特征向量集强调的是不同人脸的差异而不是照明条件、人脸表情和方向的变化。2.2.1Fisher鉴别向量将刀维空间的数据投影到一条直线上,就可以把刀维数据压缩成一维。当然这样可能会使在n维空间里原来分得很开的一些紧凑的样本集群混杂在一起。但是在很多情况下,如果把直线转动一下,就有可能找到一个方向,使样本能够在这个方向的直线上较好地分开。假设有一集合包含Ⅳ个疗维的样本而,…,h,其中Ⅳ1个样本属于q类,Ⅳ2个样本属于哆类,显然有N=ⅣI+Ⅳ2。若对样本X的分量作线性组合,则可得标量Y=wrx(2.18)这样得到相应于Ⅳ个样本的集合咒,…,蜘。从几何上看,若¨wll=1,则每个Y。就是相应的xs到方向为W的直线上的投影。实际上W的幅度是无实际意义的,重要的是W的方向。即希望落在直线上的∞类的样本和奶类的样本的投影会很好地分开而不是混合在一起。样本均值之差可用来度量投影之间的分离性,设巩是甩维样本的均值l旦他=音∑‘,i=1,2(2·19)基于神经网络的人脸识别算法研究而投影点的样本均值厩是嘎=专粪乃=专凳^=矿现待啦由此可得慨一lil2I=1w1(m。-m:)I。定义属于以类的投影样本的类内离散度为:∞∞社专薯饥吲2小-,2个线性函数矿x,它能使判决函数:(2.2·)嘱2+最2)称为投影样本的总的类内离散度。Fishcr线性判别函数被定义为这样的一圳=群而各类类内离散度越小越好(同类样本内部尽量密集)。定义样本类内离散度矩阵墨和总类内离散度矩阵瓯如下s㈣达到极大。显然,为使J最大应使两类均值之差越大越好(不同类样本分布尽量分开),2专善(_一%)q一他)r’扛1,2&=S+岛(2’23)(2.24)而2瓦1善N,(^一矿啊)22专著∥钙一玛№一他厂w=0sW因此可以得到(225)胬+§:=谚S∥同样的Q。26)(确-历2)2=(矿玛一wrm2)2----W7(啊·鸭X%-%)7w=矿墨w(2.2D12大连理工大学硕士学位论文其中矩阵最=(啊一鸭X码一鸭)7,称为类阃离散度矩阵,它是对称半正定矩阵,是二个向量的外积,所以其秩最多为l;矩阵&称为总类内离散度矩阵,它也是对称半正定阵,当N>n时通常是非奇异的。而由于Sw=(%一鸭X%一鸭)7W,因此对任意向量w,瓯’.,是在%一鸭方向上的,故瓯是奇异的。引入民和瓯,可得Fisher线性判决函数-,:㈨=等’.,微分得(2.28)这个式子是数学物理中著名的广义Rayleigh商。为了求得最优的鉴别向量,将.,对设使J达到极大的向量W必须满足;罢:昙f梁1:一2(wrSw)Sbw-2(wrSw)S,cw:0a¨,鲫Lw7瓯wJ,I,』Sww(2.29)A:掣W7&Ⅵ,(2.30)最W=碱w值问题:《1昆w=2w(2.31)这是一个求解广义特征值的问题。若&为非奇异矩阵,则可以得到一个一般的特征(2.32)而因为墨w总是在%一%方向上的,所以没有必要求出氍1瓯的特征值和特征向量。同时由于W的比例因子是非实质性的,所以可以立即把解写成:w=《1(%一%)(2.33)该向量就称为Fisher鉴别向量。Fisher鉴别向量使类间离散度同总类内离散度之比达到最大,这样就把高维模式样本(行维问题)转化为一维模式样本(一维问题)并在一维空间(直线)上保持最优的鉴别力,也就是说Fisher鉴别向量能将高维模式以最优的可分性指标变换成一维模式。2.2.2多类问题的Fisher线性判别对于Ⅳ个样本的C类问题,假设哆O=l,2,…,c)类的先验概率为P(q),Ⅳ』(f=1,2,…,c)为各类的样本数,显然有∑P(够)=l和∑M=N。基于神经网络的人脸识别算法研究Fisb盯线性判别的自然推广包括e-1个判决函数,这样就成为从刀维空间向c一1维空间作投影“…。&为类内散布矩阵,表示c类样本向量的平均散布;假设行≥c,x,(‘’表示属于q类模式的第-,个疗维样本向量,定义类内散布矩阵为&=∑P@)SS为q类的类内散布矩阵,定义为(2.34)墨2专善时’一m,Xxj(')-码)r而嘭类的均值向量能为(2.35)”亩善妒’因此类内散布矩阵&可以表示为(2.36)&=∑P@)古∑钙o’一m,Xx,o’一艰)7』T¨1I=I(2.37)类问散布矩阵&表示在总体均值向量周围各类均值向量码的分布,墨=∑P(o)jXm,一所)(嘲一聊)7其中研=∑尸(嵋)鸭为总体平均值向量。则总离散度矩阵S如下:(2.38)s=∑P(q)古∑q∽一埘)(矿一用)7f;lJ=l^』1=∑尸(q)吉∑(_o’一ra,+他一坍)(_∞一%+鸭-m)7l=1』Vf』-11“』Ⅳ‘=∑弛)古∑q(0--m,Xx./0-%)7+∑地)吉芝伽一M)@一%)7(2.39)i=1』’●J—I,cl』Vl,-I=Sw+∑P(q)(%一聊)(%一m厂=S。+sb押维空间向c一1维空间的投影是通过C一1个判别函数来实现的:卫=啦7x,i=1,…,c—l(2.40)14大连理工大学硕士学位论文若将乃看作向量J,的第f个分量,把权向量Ⅵ看作矩阵‰c-I)的第f列,即形=【M,…,H■】,则用投影矩阵表达为:J,=形7x(2.41)通过投影矩阵形将样本集而,…,h投影到相应的投影集合乃,…,蜘。令乃‘‘’表示q类的第.,个c一1维样本向量,如果定义羁=专耖历=∑P(q溉∞动(2.43)(2.44)鼠=∑P@)吉∑饥们一曩)饥o’一只)7ldI-I鼋=∑P(q)(商一历)(商一前)7可以推导出(2.45)§,=0s∥§h=订s∥Q.46)Q.47)下一步就是寻找使类间离散度对类内离散度之比为最大的变换矩阵∥,判决函数为:删,=斟=翮列的矩阵W’∈胄“。即应该使投影后的类间散布最大而类内散布最小,即(2.48)如果类内散布矩阵瓯非奇异,线性判别分析qDA)根据使投影后样本向量类间散布矩阵的行列式和投影后样本向量类内散布矩阵的行列式之比最大而得到一个具有正交∥’=fM,%,…,%】=ar91铲(2.49)其中∽1i=1,2,…,耐为墨和瓯的对应于递减的特征值集合{丑Ii=I,2,…,”的广义特征向量集合。这些特征向量称为MDF(theMostDiscriminatingFeatI腿)特征向量㈨。最wI=^Swl4,(2.50)由于类间离散度矩阵既是c个秩不大于1的矩阵之和,且其中组成矩阵的向量仅有c—1个是相互独立的,因此S的秩不大于c一1,即咒最多有c一1个特征值是非零的;而基于神经网络的人脸识别算法研究另一方面,由于任意一个矩阵左乘或右乘以可逆矩阵其秩不变,因此,矩阵s2s。的秩也不大于C—l,故s2s。也最多只有c—1个特征值是非零的,这就是说女的上界为c—l。2.2.3基于Fisher线性判别的人脸识别采用多类Fisher线性判别分析方法可以大幅降低原来模式空间的维数,并使投影后样本向量的类问散布最大、类内散布最小。然而在实际中,因为训练样本的数量往往小于每一个样本所包含的象素个数,所以样本的类内散布矩阵通常是奇异的,这就使得求解变得很困难。为了解决这个问题,从而得到最佳鉴别向量,实际中经常采用将PCA和FLD结合起来的方法,即Fisher脸方法“”.它首先利用PCA将高维空间的样本投影到低维空间,使类内散布矩阵为非奇异,然后再采用Fisher线性判别方法来求取最佳鉴别向量。如图2.1给出了Fisher脸方法的流程图。人脸图像投影予空问Fisher子空间图2.1Fisher脸方法的框图Fig.2.1TheblockdiagramofFisherfacemglhodFisher脸算法首先将人脸图像通过PCA方法投影到子空间,使空间图像转化到最佳描述特征(MEF,theMostExpressiveFeature)空间,而且使类内散布矩阵为非奇异;然后再采用Fisher线性判别分析将MEF空间转化为最佳鉴别特征(MDF。theMostDiseriminantFeature)空间,从而得到原始图像的特征。Fisher脸方法的投影矩阵为:吆=吆%其中PCA方法和Fisher线性判别分析的投影矩阵为(2.51)阡■=argmax[W1品形l(2.52)%=argmax将所有人脸图像向阡0上投影,得到可以代表人脸的特征,将其用于人脸识别。16大连理工大学硕士学位论文2.3支持向量机人脸识别算法统计学习理论(StatisticalLearningTheory或SLn是一种研究小样本情况下机器学习规律的理论…1。Vapnik等从上世纪六、七十年代开始致力于这方面的研究,到九十年代中期,随着其理论的不断发展和成熟,统计学习理论开始受到越来越广泛的重视M。统计学习理论是建立在一套较坚实的理论基础之上的,为解决有限样本学习问题提供了一个统一的框架。它能将很多现有方法纳入其中,有望帮助解决许多原来难以解决的问题(比如神经网络结构选择问题、局部极小问题等)。在这一理论基础上发展了一种新的通用学习方法即支持向量机(SupportVectorMachines,SVM),SVM把数据映射到高维特征空间,以结构风险最小化(SRM)为归纳原则,在高维空间中构造具有低VC维的最优超平面作为判决面,使风险上界达到最小,学习机器具有最优的推广能力。由于统计学习理论有完备的理论体系,以及SⅥ订具有强的推广能力,SⅥ“己经受到越来越多的重视,并在模式识别、回归估计、密度估计等领域取得了很好的成果。2.3.1支持向量机概论碰~支持向量机的最大特点是根据结构风险最小化原则,尽量提高学习的泛化能力,即由有限的训练样本得到的小的误差仍能够保证对独立的测试集的小的误差;另外,由于支持向量机算法是一个凸优化问题,因此局部最优解一定是全局最优解,可防止过学习,这些特点是其它学习算法,如神经网络学习算法所不及的。SVM方法是从线性可分情况下的最优分类面(Optin:1alHypcrplane)提出的。图2.1所示为二维两类线性可分情况,图中实心点和空心点分别表示两类训练样本,日为把两类没有错误地分开的分类线,鼠和皿分别为过两类样本中离分类线最近的点且平行于分类线的直线,腻和E间的距离称为分类空隙或分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类无错误地分开,而且要使分类空隙最大。前者是保证经验风险最小(为∞,使分类空隙最大实际上就是使推广性的界中的置信范围最小,从而使真实风险最小。推广到高维空间,最优分类线就成为最优分类面。基于神经网络的人脸识别算法研究图2.1最优分界面F培.2.1Theoptimalhyperplaned维空间中线性判别函数的一般形式为g(功=w·,+6,分类面方程为w·,+6=0,我们可以对它进行归一化,使得对线性可分的样本集@,咒)’i=l,…,栉,x∈R4,Y∈“1,-1,,其中t是输入,咒是其对应的输出,满足乃(wxj+b)-I≥o,i=l,…,r/(2.54)此时分类间隔为21I叫|,使间隔最大等价于使得0圳2最小。满足式2.54且使去fI卅J2最小的分类面即为最优分类面,喝,皿上的训练样本为支持向量。根据统计学习理论,使妻I|卅12最小可以同时使训练误差与VC维达到最小。所以目标最小化函数为。(叻:匀叫12:丢矿w在式2.54约束下利用Lagrange常数法可以构造方程(2.55)L(w,b,口)=去(Ⅵ,7们一∑口。[y。(w7t+6)一l】(2.56)其中,口。≥0为Lagrange系数,我们的问题变为对w,b求式2.56的最小值。对式2.56分别对w,b求偏微分并令它们的偏导数为0,就可以把原问题转化为如下的比较简单的对偶问题:在约束条件∑y,q=o,口.≥o,i=1,…,栉(2.57)大连理工大学硕士学位论文之下对盯.求解下列函数的最大值:Q@)=∑喁一去∑q哆只乃(而·一)I=I(2.58)●IJ-l若Z为最优解,则w.=∑彳乃五t=l(2.59)最优分类函数为f(x)=sgn(w"7x+b‘)把式2.59代人式2.60可得:(2.60),∞=鹾虹∑qY。珈+6)I=I(2.61)最优分类面是在线性可分的前提下讨论的,在线性不可分的情况下,就是某些训练样本不能满足式2.54的条件,因此可以在条件中增加一个松弛因子六≥0,变成咒(w群。+∞一l+参20,i=l'…,力(2.62)而在目标最小化函数式2.55中加入惩罚项变为:西(w,f)=去(w7w)+c∑鼻‘J{l(2.63)同样可以在式2.62的约束下利用Lagraage常数法构造方程:L(w,b,六盯)={(w7w)+c∑点一∑盯,眦(w’而+b)-q‘,t=l(2.64)式2.58可以化为其对偶形式,其对偶形式为在如下的约束下∑.),。%=o,o≤吒≤c,f=l,…,一1=1(2.65)求下式的最大值Q@)=∑%一寺∑q口,Y,Y/蜘,II(2.66)●最终的判别式可以按照式2.62得到。在这里我们注意到在最终的分类式中含有支持向量的内积运算,在它的求解运算中也包含训练样本间的内积运算,可见要解决一个最优线性分类问题,我们只需要知道这个空间中的内积运算即可。而在广义的线性判别函数问题中,如果一个问题在其定义的空间不是线性可分的,这时可以构造新的特征向量,把问题转换到一个新的高维空间中,19基于神经网络的人脸识别算法研究可能在新的高维空间中实现新的特征的线性可分。按照广义线性判别函数的思路,要解决一个非线性问题,我们可以设法通过非线性变换把原来的问题转化为另一个空间中的线性问题,在这个变换空间中求最优或广义最优的分类面。考虑到最优分类面的性质,在这个变换空间中我们需要进行内积运算。而进一步看,我们甚至没有必要知道采用的非线性的形式,而只要知道它的内积运算即可。所以我们只要定义变换后的内积运算,而不必真的进行这种变换。根据Hilbert-Sehmidt原理,只要有一种运算满足MercerEoJ条件,它就可以作为这里的内积使用。满足Mercer条件的函数通常被称为核函数。设KO。,工,)为一个核函数,那么式2.66与式2.62可以写为:1g(口)=∑吼一{∑口,口/y,Y,芷(墨,功(2.673o,@)=s烈∑吼y,K(x,,x)+6)t=l(2.68)这样支持向量机的基本思想可以概括为:首先通过非线性变换将输入空间变换到一个高维空间,然后在这个空问中求取最优线性分类面,而这种非线性变换是通过定义适当的内积函数实现的。输出(决策规则),y=赡《≥≥re再,习+6])r盏s萨4芝::n讲z’(再,习+6I\扣i/权值q—q儿基"-T-'s十支持向量XI,r2,…,r.的非线性变换(内积)输入向量‘。∥x=F,护,…,一)图2.2支持向量机示意图Fig.2.2IllustrationoftheSVM支持向量机求得的分类函数类似一个神经网络,其输出是若干中层节点的线性组合,而每一个中层节点对应于输入样本与一个支持向量的内积,如图2.2所示。20大连理工大学硕士学位论文从图2.2可以看出,支持向量机不是试图使原输入空间进行降维,而是采用一种非线性变换使输入空间升维,谋求在高维空间中问题变得线性可分。因为非线性变换只是改变了内积运算,算法的复杂性并没有随着维数的增加而增加。统计学习理论和支持向量机方法对有限样本情况模式识别问题中的一些根本性问题进行了系统的理论研究,并在此基础上建立了了一种较好的通用学习算法,以往的很多困扰机器学习的问题如模型选择与过学习问题,非线性与维数灾难问题,局部极小点问题等都在这里得到某种程度的解决,而且很多其它的机器学习方法可以看作是支持向量机方法的一种实现,因此统计学习理论和支持向量机方法被看作是研究机器学习问题的一个基本框架。支持向量机方法的几个主要优点为:.(1)它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值;(2)算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了在其它非线性优化方法中无法避免的局部极值问题;(3)算法将实际问题通过非线性变换转换到高维的特征空间,在商维空间中构造线性判别函数来实现原空间中的非线性判别函数,能保证机器有较好的推广能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关;(4)在SVM方法中,只要定义不同的内积函数,就可以实现多项式逼近、贝叶斯分类器、径向基函数(Radial习算法。目前,SVM算法在模式识别、回归估计、概率密度函数估计等方面都有应用。例如,在模式识别方面,对于手写数字识别、语音识别、人脸图像识别、文章分类等问题,SVM算法在精度上已经超过许多其它的学习算法或与之不相上下。但是由于¥LT理论和SVM方法尚处在发展阶段,很多方面尚不完善,许多理论目前还只有理论上的意义,尚不能在实际算法中实现;而有关SVM算法某些理论解释也并非完美。此外,对于一个实际的学习机器的VC维的分析尚没有通用的方法,SVM方法中如何根据具体问题选择适当的内积函数尚缺乏理论依据。2.3.2BasicFunction或lu3F)l")方法、多层感知器网络等许多现有学ECOC(Error—correctingOutputCodes)方法SVM最初设计是用作二类分类器的,而对于有多个类别的图像识别问题来说,显然需要的是多类分类器,这就需要将多个SVM组合起来使用。如何有效地将SVM从二类问题推广到多类问题还是一个正在研究的问题。当前已经有许多算法将SVM推广到多类分类器,常用的方法是用多个二类SVM分类器组成多类分类器,其中有一对一21基于神经网络的人脸识别算法研究方法嘲,一对多方法嘲,m-ary方法“。等。其中一对一方法具有较强的分类能力,分类效果较好,但是对于K类问题,它需要的二类SVM分类器个数为K(K一1)/2,这样当需要识别更多的类别时,一对一方法的使用就受到了限制。丽使用一对多方法需要五个分类器,虽然数目不太多,但其分类效果却并不理想。m-ary方法虽然只需要rlc呸足1个分类器即可,但是这组分类器中一旦某个SVM给出错误结果,将导致最终的分类错误…,所以它的分类效果并不好。由此可见。在常见方法中,要么可以达到较好的分类效果但需要较多的分类器,要么需要较少的分类器但识别效果不佳,如果能找到二者的最佳结合点,使分类器使用较少的SVM但仍能达到较高的识别率成为一个关键的问题。鉴于以上几点,文献[28]和[35]提出了基于通信中信道纠错编码方法构造出一种新的SVM多类分类方法即ECOC方法。由于它使用了通信中信道纠错编码解码技术而具有纠错能力,这样即使其中几个二类分类器产生了错误的输出结果,但由于其本身具有纠错机制,从而使这些错误对最终的分类结果不会产生影响,仍然可以得到正确的分类结果,因此这种分类器具有比其它的多类SVM分类器更好的分类效果。同时对于K类问题,这种方法仅需要比m-ary方法的flog,K]个二类分类器稍多一些,比一对一方法需要的分类器要少很多,而且还可以比一对多方法需要的分类器少,同时其分类精度得到提高㈣。下面给出对于K类问题基于ECOC方法建立SVM多类分类器的算法:训练时,首先选择合适的码长厅和最小汉明距离d,其中胛≥flog,m1+d,对每个参加训练的样本所属的类赋予唯一的码字;然后利用训练样本集建立/'/个训练集,将每个训练集划分成两个子集,根据亍集的码值每个子集被赋以l或.1,以它们作为训练时的期望输出;最后通过学习算法来训练,1个sⅥ订,获得纠错SvM分类器。检验时,利用”个已经训练好的SVM来对检验样本分类,将样本输入到每个SVM中,可以得到玎个输出值(1或.1)。在解码时,首先利用这H个值以相同的规则编码,然后利用预先选定的纠错算法进行解码并找出码字中可能的错误,最后利用解码后的数据进行分类。2.4仿生模式识别方法传统模式识别中把不同类样本在特征空间中的最佳划分作为目标,而仿生(拓扑)模式识别魄“43盯①ionfimeticPatternRecognition,BPR)则以一类样本在特征空间的分布的最佳覆盖作为目标,它可以克服传统模式识别方法对于未训练样本的高误识率问题。以二维空间为例,如图2.3所示。大连理工大学硕士学位论文图2.3仿生模式识别方法的二维空间覆盖示意图Fig.2.3Theschematicdiagramofbionlimeticpatternrecognitionalgorithm在图2.3中,三角形为待识别样本,圆形和十字形为其它类样本,图中的椭圆覆盖范围代表的是仿生模式识别的覆盖方式。仿生模式识别与传统模式识别的差异如表2.1所示。表2.1仿生模式识别和传统模式识别的差异Tab.2.1Thedifferencesofbiomimeticandtraditionalpatternrecognition传统模式识别基本出发点数学工具分析方式识别方法实现途径多类样本的最优分类统计学代数、方程的理论推导划分支持向量机、神经网络等仿生(拓扑)模式识别一类类样本的认识拓扑学高维空间画法几何高维空间复杂集合形体覆盖多权值高阶神经元网络仿生模式识别使用的方法是“高维空间复杂几何形体覆盖识别”的方法m‘“,是在特征空间中研究某类样本的分布状况而加以合理覆盖。仿生模式识别的实现过程是利用多权值高阶神经元网络建立高维空间封闭超曲面完成对“事物”的最佳覆盖过程‘””,可以利用双突触权值高阶神经元。““的数学模型来描述,所采用的基本的计算模型如下:r=四n赢w(x崩-w'刊%(xj-呓)lP_Or】嚣为空间的维数;s为决定单项正负号的参数;P为幂参数。(2.69)式2.69中:Y为神经元的输出;f为神经元的激励函数:∥为神经元的激活阈值;w,和∥为由第,个输入端接至神经元的方向权值与核心权值;x,为第,个输入端输入;基于神经网络的人脸识别算法研究如果设定s=O,上式就是一个封闭的超曲面神经元。如果将函数,的基设为定值,那么输入点的轨迹就是一个封闭的超曲面,这个超曲面的覆盖范围即为输入点的覆盖范围。它的核心位置由核心权值矢量决定,形状由P的值决定·此时若使一取不同的值,则相当于将封闭曲面在不同方向加以拉伸或压缩,从而形成不同的形状㈨。大连理工大学硕士学位论文3基于超椭球神经网络和纠错SVM的二次分类方法3.1二次分类方法在上一章中介绍的超椭球神经网络分类方法,由于它是仿生(拓扑)模式识别的应用,所以它具备了仿生模式识别理论的特点,对未训练样本有着极低(几乎为o)的误识率“”:但是由于它不是对整个空间的划分,而是对每类样本的覆盖过程,所以整个空间中可能会有没被覆盖到的空间。而如果检验样本落在这些空隙中,它们就不被任何一个分类器所识别;或者由于两类样本的覆盖区域有可能发生重叠,所以某个检验样本可能被两个或两个以上的分类器识别,我们称这两类样本为“问题样本”。对于这些“问题样本”,仅仅使用超椭球神经网络进行一次分类无法得到最终的分类结果(无论是正确的还是错误的),即超椭球神经网络分类方法对检验样本有着一定的错误拒识率。那么对这些“问题样本”我们应该如何处理呢,是不是就束手无策了昵?本文提出一种二次分类方法,旨在解决第一次分类中无法识别的样本。对于在第一次分类中遗漏的“问题样本”,利用另一种分类方法进行二次分类,从而得到最终的分类结果;而对于在第一次分类中即可得到结果的样本,可以认为对其识别已经结束,不需要再进行二次分类,也可以再利用另一种方法进行二次分类,而最终的分类结果由两次分类的结果共同决定。但在本文中对于在第一次分类就可以得到分类结果的样本,就认为对它们的分类已经结束,以第一次的分类结果作为最终结果,不再对它们进行二次分类了。当然,所用到的二次分类的方法就不应该是基于仿生模式识别理论的方法了,而应该是能够弥补第一次分类器的缺点的分类方法,否则有可能还会有“问题样本”的出现。因此本文中用到的二次分类方法为模式空间划分的分类方法,它们在用于模式分类时均不会发生拒识现象,这样到最后识别结束时所有样本均可被分类,不再有拒识现象的存在。二次分类方法将超椭球神经网络方法和模式空间划分的分类方法结合起来,在改善识别率的同时,也在一定程度上避免了对未训练样本的高误识率问题。Y图3.1二次分类方法的块状图F嘻3,1Blockdiagramofthetwo-passclassificationapproach基于神经网络的人脸识别算法研究如图3.1所示为二次分类方法的结构图。其中z为待分类样本,首先使用超椭球神经网络进行分类,得到分类结果%,如果该样本在第一次分类中可以被识别,此时认为识别结束,以第一次分类的结果作为最终结果;若该样本在第一次分类中无法被识别,则利用二次分类器其进行第二次分类,最终的分类结果y是由两个分类器所共同决定的。与普通的并联或者串联的多级分类器不同的是,本文提出的二次分类方法中所包含的两个分类器的分类结果互不影响,而且可以达到互补的作用。简单的说就是,在超椭球神经网络的识别结果中存在着一定量的“问题样本”,可以将这些样本输入到二次分类器中进行第二次分类,“问题样本”中可能会有部分样本被二次分类器正确分类,从而总的识别率会得到提高;而从另一方面来看,单一的基于模式空间划分的分类器总是存在着一定的误识率,这时可以认为这些被误识的样本可能会有一部分已经在第一次识别中被超椭球神经网络正确分类。而二次分类方法的判别准则为,在第一次分类中,如果样本可以被超椭球神经网络所分类,其最终结果以第一次分类结果为准,所以总的识别率也可能会得到提高。但二个分类器的先后顺序却并不可以颠倒,这是因为超椭球神经网络分类器的识别结果中有“问题样本”的存在,可以利用二次分类器对其进行二次分类;而如果利用二次分类器进行第一次分类,由于它对所有样本均可进行分类得到分类结果,根本无法得到“问题样本”,二次分类也就无从谈起,所以两个分类器的顺序并不可以颠倒。选用不同的二次分类器可以得到不同的分类器组合,而二次分类器的选取会影响到最终的分类结果。例如选用最常见的最近邻分类器ⅨNN)作为二次分类器,即认为二次分类时检验样本与它距离最近的训练样本属于同一类别,如图3.2所示。由于最近邻分类方法本身的正确识别率有限,这样即使对所有“问题样本”均进行了二次分类,最终结果中出现错误的概率也相对较大。拦繁避嚣静突器y图3.2基于仿生模式识别和最近邻分类器的二次分类方法的块状图Fig.3.2Blockdiagramofthetwo-passclassificationapproachbasedOilBPRandKNN大连理工大学硕士学位论文而如果选用在单独分类时正确识别率较高的分类方法,则它对。问题样本”的正确识别率也会相对较高,从而可能会使总的正确识别率提高。3.2基于超椭球神经网络和纠错SVM的二次分类方法在上一节中提到,二次分类器的选取影响着最终的分类结果,较好的二次分类器可能得到更好的分类效果。最简单的二次分类方法是将超椭球神经网络和最近邻分类方法结合起来,利用最近邻分类器来解决第一次分类中出现的“问题样本”,但由于最近邻分类方法的正确识别率并不高,所以可能会影响到总的正确识别率。本文提出将纠错SⅥ讧方法和超椭球神经网络方法结合起来,得到一种基于纠错svM和超椭球神经网络的二次分类方法,并将其应用在人脸识别中。3.2.1人脸识别的超椭球神经网络算法及其实现在式2.69中,如果取S=0,P=2,同,则模型可以转化为lr=九∑0一∽一嘭)12一口2】,若将函数/的基设为定值0,则有∑嵋(xj一嵋)2=口2,可jj=lJ-t以看出,此时的输入点轨迹是高维空间中一个封闭的超椭球,输入样本点的覆盖范围为高维空间中的超椭球体,因此这种方法叫做超椭球神经网络饵同帅方法。判断检验样本是否属于某类,只需要考察它是否落在该类所构成的超椭球体的覆盖范围内即可。其模型如图3.3所示。⑥⑥⑧图3.3超椭球神经元的模型Fig3.3ThemodeloftheHyper-EUipsoidNeuron基于神经网络的人脸识别算法研究在图3.3中,矢ix,,恐,…,毛为输入的训练样本,嵋,%,…,%和嵋,嵋,…,嘭分别为方向权值与核心权值,口2为门限值,矿(·)为非线性函数,矿o)2寿,y为网络的输出。我们采用如下的算法来训练超椭球神经网络:(1)初始化:Ⅵ、口卜小的随机数,而对于核心权值.1.f则取两个训练样本的中心点而不参与训练;(2)输入‘o=l,2,…,功,计算输出y=pl∑嵋“一叫)2-82l;涨用梯度下降法更新她有援嚣;鬈淼;!}),其中j△嵋。一VmE(w)=2(d一力’J,’(1一力’w他)‘阮一叫(。)】2,lA8=一KE(川=--2口一力·Y·(1一力·以E(w)为误差能量,口与∥为学习步长,d为期望输出;(4)如果误差能量E(w1小于某个给定值,则认为网络收敛,此时训练结束;否则k卜k+l,goto(3)。由于超椭球神经网络的输出y=伊l∑Ⅵ“一形)2一目2l,所以有y∈【o,l】,可以得到这样的结论:当样本点位于超椭球体的表面时,输出为0.5;当样本点位于超椭球体内部时,网络的输出小于O.5;而当样本点位于超椭球体外部时,网络的输出大于O.5。所以在训练超椭球神经网络时,对于本类样本而言,应使其期望输出为0;而对于其他类样本而言,应使其期望输出为I。训练结束时,可以得到超椭球神经网络的参数,即分类器的参数。在检验时,对于检验样本若网络实际输出大于0.5,即样本点位于超椭球体外部,则认为该样本不属于构成超椭球体的样本的那一类;反之,着实际输出小于0.5,此对样本点位于超椭球体内部,则认为该样本属于构成超椭球体的样本的那一类。对于所有K类样本而言,共需要K个分类器。对于每个分类器而言,它是由若干个超椭球体连接而成,如图2-3所示。在本文的仿真实验中,构成分类器的每个超椭球由同类的两个训练样本决定,而本类的其他样本并不参加训练。这样,对于每一类样本而言,如果参加训练的样本共有c个,那么该类分类器由(D1)个超椭球体连接而成。大连理工大学硕士学位论文超椭球神经网络是仿生模式识别理论的应用,它可以避免对未训练样本的高误识率闯题,可以将它用于人脸识别中。由于共有40类样本,每类5个样本参加训练,所以共需要训练40个分类器,每类分类器由4个超椭球体连接而成,这样一共需要训练160个超椭球神经网络。在训练前,首先对每一类参加训练的5个样本排序,然后按照顺序来训练网络。在训练时,参与构建超椭球体的两个样本和所有其它类样本均参加训练,而本类的其他三个样本不参加训练。下面给出超椭球神经网络用于人脸识别时的训练算法:(1)排序:对于第i(j=1,2,…,K)类样本而言,计算其所有C个参加{J11练样本中每两个样本之间的距离,这样共有c(c-0/2个距离,选取其中的最小值,以构成最短距离的两个样本‘和工,(f,,=1,2,…,C)来构建第一个超椭球;计算其余所有样本和薯(或x,)之间的距离,若鼍与t(或x,)之间的距离最小,则以^与t(或工,)来构建第二个超椭球;然后以以作为基准点,来构建第三个超椭球,以此类推,对于每类样本共可构成C-1个超椭球;(2)坐标轴旋转:由式∑u(工,一形)2=p2可知,输入点轨迹是高维空间中一个封闭习‘‘的超椭球,输入样本点的覆盖范围为高维空间中的超椭球体,而且这个超椭球体的各个轴是与各个坐标轴互相平行的。但是在实际训练过程中,由于参与构建超椭球体的两个训练样本的连线通常与坐标轴是不平行的,这就造成了实际训练的超椭球体与期望的不相符。以2维空间为例,如图3.4所示。y‘Y⑧O(g0/媳口(a)(b)图3.4坐标轴旋转前后的超椭球神经网络的覆盏范围(c)Fig.3,4ThecoverageoftheHENNbeforeandaf}ertherotationofthecoordinateaxis基于神经网络的人脸识别算法研究在图3.4中,点A与点B代表参与构建超椭球的两个训练样本,我们所需要的显然是图3.4(a)中所示的形状;而如果按照翦文所给出的算法来进行训练,那么得到的将是如图3.4(b)中所示的形状;所以在实际中,需要先进行坐标轴旋转,使线段AB与一个坐标轴平行而与另一个坐标轴垂直,如图3.4(c)所示,这样训练得到的几何形状才为所求。而在实际的人脸识别问题中,所用到的样本特征均为多维的。这样如果想达到预想的效果,仅进行一次坐标轴旋转显然是不够的,此时需要进行多次坐标轴旋转才能够使线段AB与一个坐标轴平行而与其它所有坐标轴均垂直。如果所用到的特征向量是Ⅳ维的,则需要进行(N-I)次坐标轴旋转;(3)N练:将构建超椭球两个样本的期望输出设置为0,其他类训练样本的期望输出设置为1,本类的其他几个样本不参加训练,KlJJJII练结束后对于每类样本可得到由c.1个超椭球构成的分类器。若共有足类样本,则需要训练K×(C—1)个超椭球神经网络。训练结束后,得到足×(C—D个超椭球神经网络,即得到所有足个分类器。检验算法:(I)计算检验样本在每个分类器的输出,由于每类样本的分类器由C-1个超椭球体连接而成,所以需要计算检验样本在每个超椭球神经网络中的输出;(2)要判断检验样本是否属于某类,就要看它是否被该类训练样本的覆盖空间所包含:而要判断检验样本是否被某类训练样本的覆盖空间所包含,就要看该样本是否落在该类的C-1个超椭球体的覆盖范围中。如果检验样本在某个超椭球神经网络的输出小于O.5,则检验样本落在构建超椭球体的那一类样本的覆盖空间中,否则相反;(3)如果某个检验样本只被一个类别的样本的覆盖空间所包含,则检验样本属于该类;如果不被任何一类样本的覆盖空间所包含,显然此样本被拒识;而如果被两类或两类以上样本的覆盖空间所包含,亦无法断定该检验样本的类别,此时同样对该检验样本拒绝识别。3.2.2人脸识别的纠错SVM算法及其实现’文献[28]和[35]提出的基于通信中信道纠错编码方法构造出的一种SVM多类分类方法即ECOC方法,由于它使用了通信中信道纠错编码解码技术而具有纠错能力,因此这种分类器具有比其它SVM多类分类器更好的分类效果。同时对于K类问题,这种方法仅需要比m-ary方法稍多一些的二类分类器(即稍多于rlog:足1),比一对一方法需要的分类器要少很多,而且其分类精度有所提高。大连理工大学硕士学位论文文献[51]提出将通信中的BCH码用于ECoC方法中,BCH码是一种重要的循环码,它可以方便的纠正多个随机错误码。BCH码一般用符号(雄,k)来表示,其中k是每组二进制信息码元的数目,以为码长,即编码的总位数,厅一k为监督码元数目(监督位数)。码长以与监督位、纠错个数t之间的关系为:对于任一正整数m,必定存在一个珂=2”一l,监督位一一k≤mt,能纠正所有不大于f个随机错误的BCH码。因此可以按照系统设计的要求预先设定分类器的纠错能力,来满足系统的要求。鉴于纠错SVM具有更高的分类精度,可以将该算法用于人脸识别问题。由于本文中所用的人脸库共有40类人脸,所以可以用6个信息位来表示。因此对于本文而言,选用(31,6)的BCH码,码长为3l,其中6位是信息位,最小汉明(H柚珊晒g)距离为15,最多可以纠正7位错误,这种方法一共需要31个支持向量机。利用BCH码与SVM结合的多类SVM分类算法可以分为两部分,~是训练算法,二是识别算法蚓。调练算法:(1)对于一个置类问题,首先应该选择合适的码长阼和适当的纠错能力,,根据纠错原理n与,的关系为:n>-[1092k]+2/+l;(2)生成码长为露,码间最小汉明距离为2,+1的BCH码;(3)对于每个参加训练的样本所属于的类赋予一个唯一的码字c饭),七=l,2,…,K;(4)利用训练样本集t={@c(七)),七=l,…X>建立11个训练集《={(刁,巧),彳u巧=疋,砰n≈=ep,i=1,2…功,其中≈与乏的划分按照如下的规则:对于训练样本G,c(t”∈C。如果码字c(K)的第i位为l,则把该样本放入掣,否则把它放入曩;(5)利用每个集合《训练一个SVM,从而获得二值分类函数厂‘(力,每个二值分类函数f‘O)的理想输出Y按照下列规则获得:当样本伉C@))∈五。时,二类分类函数的理想输出Y‘被赋予1,否则被赋予.1:按照上述的学习算法,可以得到n个可以解决二类分类问题的S、qvI,每个SVM对应于~个最优分类面。利用上面训练得到的n个SVM,就可以对检验样本进行分类了,分类的算法步骤为:(1)输入要被分类的样本工;基于神经网络的^硷识别算法研究(2)以<--0,七=1,2…,K;(3)f+.0;(4)利用第f个SVM对输入样本X进行分类,这样可以得到第i个SVM的输出少,∥=f‘O);(5)当夕。=l时,圪卜圪+l(凡是k对应的码字c(_i})其第f位为1);否则当多‘=-1时,圪卜圪+1(凡是k对应的码字c(七)其第i位为o);(6)当f<n时,i卜i+1并且goto(4),否则goto(7);(7)通过公式七=argm鍪K获得最终的分类结果。在分类算法中采用的是投票(.i}=a略m琴圪)的方法,它可以按照纠错原理进行纠错。3.2.3基于超椭球神经网络和纠错¥VM的二次人脸识别算法对于纠错SVM方法丽言,由于它利用了通信中的信道差错控制编码技术而具有了一定的纠错能力,因此这种分类器具有更好的分类效果。本文将纠错SVM分类器与超椭球神经网络结合起来组成一个二次分类器,并将其用于解决人脸识别问题。基于超椭球神经网络和纠错SVM的二次分类方法的结构如图3.5所示。图3.5基于仿生模式识别和最近邻分类器的二次分类方法的块状图Fig.3.5Blockdiagramofthe似o.p∞sclassificationapproachbasedonBPRandKNN由图3.5可以看出,基于超椭球神经网络和纠错SVM的二次分类方法只是将二次分类器换成了具有较高的正确识别率的纠错SVM分类器,从而可能得到更高的正确识别率。同样的,二次分类方法也分为训练和检验两个部分,下面分别给出它们的算法。训练算法:(1)利用全体训练样本,以3.2.1节中的算法来训练超椭球神经网络,随机取每类的5个样本参加训练,这样在训练结束时每类可以得到4个超椭球神经网络,它们一起构成了该类的分类器;而对于所有40类样本来说,一共可以得到160个超椭球神经网络,即40类分类器;大连理工大学硕士学位论文(2俐用全体训练样本,以3.2.2节中的算法来训练纠错SⅥ江分类器,得到纠错SVM分类器的参数。训练结束后。得到超椭球神经网络分类器和纠错SVM分类器,可以将它们用于检验样本的识别中。检验算法:(1懈全部检验样本送入超椭球神经网络中进行分类,得到中间分类结果珞,完成第一次分类。第一次分类的结果共有三种情况:一是检验样本只被一个分类器所识别;二是检验样本未被任何分类器所识别;第三就是检验样本被两个或两个以上的分类器识别。对于第一种情况,认为对这些样本的分类已经结束,以第一次分类的结果作为它们的最终分类结果:而对于第二和第三种情况,仅使用超椭球神经网络分类器无法得到最终的分类结果,需要对其进行二次分类;(2懈第一次分类中出现的“问题样本”送入已经训练好的纠错¥VM中进行二次分类,得到这些“问题样本”的二次分类结果;最终的分类结果由两次分类结果所共同决岛零由于第M--个分类器会对第一次分类中出现的所有“问题样本”进行二次分类,而且单独使用纠错s、n幢分类器时的正确识别率也相对较高,因而得到正确的分类结果的可能性也较大,所以总的正确识别率可能会比使用最近邻法进行二次分类时有所提高。本文将在下一章中进行仿真实验并给出使用单一分类方法和二次分类方法时的仿真实验结果及分析。基于神经网络的人脸识别算法研究4实验结果与分析本章中将二次识别方法应用于人脸识别,进行了大量仿真实验,同时也对单一的超椭球神经网络和纠错SVM方法进行了大量实验,分别统计各种方法的正确识别率(CRR)、错误拒识率(FRR)和错误接受率(FAR).本文实验所用的是CambridgeORL人脸库,其中共包含40个人,每人10幅图像,共400幅图像。它们有着不同的面部表情,如眼睛是否睁开,表情是否微笑,以及是否戴着眼镜等等。在每次仿真实验中,随机选取每个人的5幅图像(共200幅)作为训练样本,剩下的200幅作为检验样本。选取不同的二次分类器可以得到不同的分类器的组合,而不同的特征选取方法也会得到不同的分类结果。在特征提取时,本文分别采用了PCA特征和Fisher特征;而在二次分类器的选取时,分别采用了最常见的最近邻分类法和纠错SVM分类方法。将不同的特征提取方法和不同的分类器互相组合,可以得到多种人脸识别方法。本文对每种方法均了进行lO次仿真实验,每次实验的训练样本均为随机选取,但不同方法的样本选取方法是相同的(如在每种方法的实验中,都将lO个样本的前5个用于训练,后5个用于检验),以lO次实验结果的平均值作为最终结果。4.1由超椭球神经网络和最近邻分类器构成的二次分类方法的仿真实验在本节实验中,首先提取原始图像的PCA或Fisher特征,得到输入特征向量,将其作为超椭球神经网络的输入进行训练,得到网络参数。按照3.2.1节中的算法来训练分类器,由于每个超椭球神经网络由两个样本点所决定,而每一类参加训练的共有5个样本,所以每一类的分类器由4个超椭球体互相连接而成。而由于共有40类样本,所以需要40个分类器,这样就一共需要训练160个超椭球神经网络。然后利用得到的分类器对检验样本进行分类得到分类结果。在分类时,判断某个检验样本是否属于某类,只需要考察它是否落在该类训练样本在空间的覆盖范围内即可,如果在该类的空间覆盖范围内,则认为其属于该类;反之则不属于该类。若某个检验样本只落在某一类的空间覆盖范围内,则认为分类结束,判定检验样本属于该类;如果某个检验样本不在任何类别的空间覆盖范围内,则说明它不被任何样本所识别,此时认为该样本被拒识;而如果某个检验样本被两类或两类以上样本的覆盖空间所覆盖,此时无法对该样本进行分类,则同样认为该样本被拒识。表4.1给出了在PCA特征下仅利用超椭球神经网络分类器进行识别的仿真实验结果,该结果是用检验样本进行测试获得的,为10次不同实验的平均结果。大连理工大学硕士学位论文表4.1不同PCA特征维数下HENN方法的仿真实验结果Tab.4.1SimulationresultsbyHENNwithdifferentnumberofPCAfeamres错误接受率(FAR)0.00%0.00‰0.00%0.00%0.00%错误拒绝率(FRR)14.75%13.85%13.20%12.20%11.70%正确识别率(CRR)85.25%86.15%86.80%87.80%88.30%从表4.1中可以看出,超椭球神经网络方法的最大特点就是它的错误接受率非常的低(为o),也就是说对于那些它所能够分类的样本,正确识别率为100%。这是由于超椭球神经网络方法的理论基础是仿生模式识另B理论,它可以克服模式空间划分方法对未训练样本的高误识率问题。但这种方法的错误拒绝率却有1I-15%左右,从而造成了它的正确识别率并不高,只有85-88%左右。这是因为仿生模式识别理论的分类原理是对每类样本在空间的最佳覆盖过程,而不是对模式空间的划分,所以可能会有一部分样本不被任何分类器所覆盖,从而造成拒识;同时由于不同类别样本的空间覆盖范围可能会有重叠区域,检验样本可能会落在重叠区域内,这也造成了对该检验样本的无法识别,此时同样也认为该样本被拒识。本实验是在PCA特征下,采用不同的特征维数进行的,可以看出采用超椭球神经网络方法的正确识别率是随着特征维数的增加而提高的,从20维时的85.25%增加到39维时的88.30%,而相应的错误拒绝率则逐渐减少,错误接受率始终保持为0。在使用Fisher脸方法时,由于特征数目最大只能为类别数减一,所以特征数目最大为39。对类间离散度矩阵进行变换时,选取类内离散度矩阵最大的140个特征值和它们所对应的特征向量。表4.2不同Fisher特征维数下HENN方法的仿真实验结果Tab.4.2SimulationresultsbyHENNwithdiffemmnumberofFisherfeatures错误拒绝率(FRR)正确识别率(CRR)11.65%10.95%10.70%8.20%8.05%91.80%91.95%88.35%89.05%89.30%表4.2给出了Fisher特征下仅利用超椭球神经网络分类器进行识别的仿真实验结果。同样的,该结果也是用检验样本进行测试获得的,为10次不同实验的平均结果,10次基于神经网络的人脸识别算法研究实验所选取的样本与上一次实验完全相同,本文余下的仿真实验均是在相同条件下进行的,实验结果也均为平均结果,以后不再特别说明。由表4.2可知,采用Fisher特征时的正确识别率要比采用PCA特征时高出3个百分点左右,而且正确识别率随着特征维数的增加而提高,从20维特征时的88,35v,提高到39维时的91.95%,而由于采用的是Fisher特征,所以最大特征维数为类别数减一,在本文中为39。同样的由于它采用的是超椭球神经网络分类方法,所以它的错误接受率也非常的低(为0),它的错误拒绝率也相对较高,为8一n%左右。在特征数目为35至39时,正确识别率变化不大,而且仿真实验具有一定的随机性,所以在实际中通常取最大的特征脸数,即类别数减一。最简单的二次识别方法是将超椭球神经网络分类方法和最近邻分类法相结合。由于在利用超椭球神经网络进行第一次识别时出现了一些“问题样本”,超椭球神经网络分类器无法得到它们的最终分类结果,所以它们的存在对最终的正确识别率有着较大的影响。为了消除它们的影响,我们应用本文的二次分类方法,用最近邻分类器进行第二次分类来解决第一次分类中存在的“问题样本”,使总的识别效果得到改善。表4.3为在不同的PCA特征维数下的基于超椭球神经网络和最近邻分类器的二次分类方法的识别效果。表4.3不同PCA特征维数下二次分类方法0mNN+KNN)的仿真实验结果Tab.4.3Simulationresultsbytwo—passclassificationmethod(HENN+KNN)withdifferentnumberofPCAfeatures错误接受率(FAR)5.10%5.05%3.90",63.60%2.55%错误拒绝率(FRR)0.00%0.00%0.00%0.00%0.00%正确识别率(CRR)94.90%94.95596.10%96.40%97.45%由表4.3可以看出,由于采用了最近邻分类器来进行二次分类,在第一次分类中出现的“问题样本”可以在第二次分类中全部被识别,所以错误拒绝率为0;而由于最近邻方法可自E会产生错误接受现象,所以总的错误识别率并不为O;但是可以看出,采用这种二次识别方法的正确识别率已经比仅仅采用超椭球神经网络方法都有了明显的提高,提高了lO个百分点左右。而且随着特征维数的增加,正确识别率也随之提高,在特征维数为39时达到最高,为97.45%。‘大连理工大学硕士学位论文表4.4不同Fisher特征维数下二次分类方法(11刚N+KNN)的仿真实验结果Tab.4.4Simulationresultsbytwo-passclassificationmethod(HEl州+KNN)withdifferentnumberofFisherfeatures错误接受率(FAIi)正确识别率(cRR)3.25%2.95%2.90%2.70%2.10%错误拒绝率(FIl助0.00%0.00%0.00%0.00%0.00%96.75%97.05%97.109697.30%97.90%表4.4为不同的Fisher特征维数下基于超椭球神经网络和最近邻分类器的二次分类方法的仿真实验结果。与采用PCA特征相比,采用Fisher特征的二次识别方法有着更高的正确识别率,大约提高了0.5-2个百分点左右。同样的,由于在二次分类中采用的是最近邻分类方法,所以错误拒绝率仍然为0。同时这种方法的正确识别率也随着特征维数的增加而增加,相应的错误识别率也随之减少。在特征维数为39时,正确识别率达到97.90%。4.2由超椭球神经网络和纠错sVM分类器构成的二次分类方法的仿真实验选取不同的二次分类器可以得到不同的二次分类方法。一般来说,将单独使用时正确识别率较高的分类器用作二次分类器,可能会解决更多的在第一次分类中遗留下来的“问题样本”,从而得到更好的分类效果。本文将超椭球神经网络和纠错SVM相结合构成二次分类器,并对其进行仿真实验。首先对于纠错SVM方法,采用的是具有纠错能力的BCH码。由于ORL人脸库中人脸类别数为40,用6个信息位就可以表示,所以采用的是(3l,6)的BCH码。它的码长为3l,其中有6位是信息位,最小汉明饵amming)距离为15,最多可以纠正7位错误。对于一共有40类问题的人脸识别而言,这种方法一共需要31个支持向量机,仅仅需要比rIog,K]稍多一些的分类器,比需要K(K一1)/2个二类分类器的一对一方法需要的分类器要少很多。表4.5给出了采用PCA特征,特征维数不同时仅使用纠错SVM分类器进行分类时的识别效果。基于神经网络的入脸识别算法研究表4.5不同PCA特征维数下纠错SVM方法的仿真实验结果Tab.4.5SimulationresultsbySVMwithECOCwithdifferentnumberofPCAfeatures错误接受率(FAR)5.10%4.70%4.65%4.55%4.55%错误拒绝率(F脓)0.00%0.00%0.00%0.00%0.00%正确识别率(CRR)94.900595.300595.35%95.45%95.45%从表4.5中可以看出,在纠错SVM方法中,它的错误拒绝率为0,这是因为SVM是基于对空间划分的方法,所有的样本均可以被分类,无论结果对错,所以说它的错误拒绝率为0。而且从表4.5中可以看出,随着特征数目的增加,正确识别率也随之增加,在特征数目为39维时,正确识别率达到最高,为95.45%。在使用Fisher特征时,首先原始图像经过两次降维过程得到Fisher特征,同样的,由于采用的是Fisher特征,所以特征的最大维数仍为39;然后对Fisher特征进行编码,并将其送入纠错SVM中来训练纠错SVM,得到纠错SvM分类器的参数,最后将检验样本送入分类器中,进行解码分类,从而得到最终的结果。表4.6给出了在不同的Fisher特征维数下仅采用纠错SVM方法时的识别效果。表4.6不同Fisher特征维数下纠错SVM方法的仿真实验结果Tab.4.6SimulationresultsbySVMwithECOCwithdiffeⅢatnumberofFisherfeatures错误接受率(FAR)5.05%3.55%3.50%2.70n/,2.25%0.00%97.75%错误拒绝率(F职)0.00%0.00%0.00%0.000,6正确识别率(cIiR)94.95%96.45%96.509697.30%从表4.6中可以看出,对于纠错SVM分类方法,错误拒绝率仍为O%。正确识别率为95.98%左右,在使用Fisher特征时的正确识别率要比使用PCA特征时的识别率高出2个百分点左右;而且正确识别率也由20维时的94.95%增加倒39维时的97.75%,这说明随着特征维数的增加,这种方法的正确识别率也是随着增加的,相应的错误识别率则随之减少。对于纠错SVM方法而言,由于它利用了通信中的信道差错控制编码技术,因而具有了一定的纠错能力,这样即使几个二类分类器产生了错误的输出结果,但由于具有纠大连理工大学硕士学位论文错机制,这些错误对最终的分类不产生影响,仍然可以得到正确的分类结果,因此这种分类器具有相对较好的分类效果。正是因为纠错SVM在单独使用时具有较高的分类精度,所以接下来我们采用纠错SVM分类器作为二次分类器,将其与超椭球神经网络结合起来,得到基于超椭球神经网络和纠错SVM分类器的二次分类方法,这也是本文所要研究的重点内容。这种方法的识别过程为:首先提取原始人脸图像的PCA特征或Fisher特征,利用所有训练样本来分别训练超椭球神经网络和纠错SVM分类器,得到二者的参数;然后将检验样本送入超椭球神经网络进行检验,得到第一次分类结果%。对于匕中的“问题样本4,将它们送入纠错SVM分类器中进行二次识别,从而得到最终的分类结果;而对于在乓中可以被分类的样本,可以认为对其识别已经结束,不需要再进行二次分类,也可以再利用纠错SVM分类器再进行二次分类,而最终的分类结果由两次分类的结果共同决定。但在本文中对于%中可以得到分类结果的样本,就认为对它们的分类已经结束,以超椭球神经网络的分类结果作为最终结果,不再对它们进行二次分类了。。表4.7为采用PCA特征时,不同维数下的基于超椭球伸迸网络和纠错SVM分类器的二次分类方法的仿真实验结果。表4.7不周PCA特征维数下二次分类方法(HENN+纠错SVM)的仿真实验结果Tab.4.7Simulationresultsbytwo-passclassificationmethod(HENN+SVM’switlIECOC)withdifferentnumberofPCAfeatures错误拒绝率(F艘)正确识别率(CRR)O.00%0.Oo%0.00%0.00%0.Oo%98.05%98.20%98.30%98.30%98.30%从表4.7中可以看出,基于超椭球神经网络和纠错SVM分类器的二次分类方法的正确识别率均高于98.00%,这要高于基于超椭球神经网络和最近邻法的二次分类方法,而且要比单纯使用一种分类器如最近邻分类器、超椭球神经网络分类器和纠错SVM分类器都有了不同幅度的提高。这种二次分类方法的错误拒绝率始终为0,这也是因为在第二次分类时采用的是纠错SVM方法,所以在第一次识别中未能被分类的样本最终均可被纠错SVM分类,即无拒识现象的发生;但错误接受率不为0是由于纠错SVM方法本身会产生错误识别,所以最终结果会有一定的错误识别率。而同样的,这种二次分基于神经网络的人脸识剐算法研究类方法的正确识别率基本上随着特征维数的增加而提高,在特征维数为39维时,正确识别率达到最高,为98.30%。接下来我们采用Hsher特征来验证基于超椭球神经网络和纠错SVM分类器的二次分类方法的分类效果,表4.8给出了不同维数的Fisher特征的仿真实验结果。表4.8不同Fisher特征维数下二次分类方法o{卧IN+纠错SVM)的仿真实验结果Tab.4.8simuI商衄螂IIl臼bytwo-p硒sclassificationmcthod(HD4N+sVM’sw岫ECOC)wimdifferentnumberofFishcrfeatures错误接受率(FAll)1.45%1.4551.45%0.9550.7550。009699.25%错误拒绝率(FRR)0.Oo%0.00%0.Oo%0.005正确识别率(CRR)98.55%98.55%98.55%99.05%如表4.8所示,采用Fisher特征时错误拒识率仍然为0,正确识别率随着特征维数的增加而增加,在特征为39维时,它的正确识别率达到99.25%,而且Fisher特征的识别率在总体上要比PCA高出1个百分点左右。为了验证不同的单一分类方法,选取不同的二次分类器的二次分类方法以及选取不同特征时的分类器的性能,表4.9分别给出了在特征维数为39时它们各自的分类结果。表4.9不同特征下不同的分类方法的仿真实验结果Tab.4.9Simulmionresul忸withdiffer∞tfeaturvs∞ddi丘brentcl∞sitiers如表4.9所示,基丁超椭球神经网络和纠锚SVM分类器的二次分类方法有着所有给出分类方法中最高的正确识别率。纠错SVM分类器的正确识别率比最近邻分类器高出2个百分点左右,这是因为它采用了通信中的信道差错控制编码技术,因而具有了一定的纠错能力,从而得到了更好的分类效果。进而,利用纠错SVM方法要比利用最近大连理工大学硕士学位论文邻分类法作为二次分类器的二次分类方法有着更高的正确识别率,这是因为单一的纠错SVM分类器会在二次分类中将更多的“问题样本”正确分类。采用基于超椭球神经网络方法和纠错SVM分类器的二次分类方法时,不同的特征对识别率的影响也几乎相同,采用Fisher特征的识别效果要比采用P(A特征时更好。而这种方法的正确识别率也是随着特征维数的增加而提高,在特征为39维时达到最高,为99.25%。二次分类方法能获得较高的正确识别率的关键是它对未训练样本的误识率极低,也就是说它所能分类的样本的正确识别率是1000,6,这一点保证了它能够获得比单一的一次分类方法更高的正确识别率。综上所述,本文的仿真实验结果表明:由最近邻分类法构成的分类器需要的时间最少,它不会产生拒识现象,但是它有大量的误识现象的发生,所以其正确识别率相对较低;采用纠错SVM分类方法可以得到较高的正确识别率,而且由于它的分类原理是对模式空间的划分,所以它的拒识率也为0,但是它还是存在一定的误识率;超椭球神经网络方法有着90%左右的正确识别率,而且由于它的分类原理是对样本的最佳覆盖过程;所以它的错误接受率几乎为0,但是由于可能会有某个样本不被任何分类器所识别,而且有可能会发生某个检验样本被两类或两类以上分类器所同时识别的现象,即产生“问题样本”,所以它会造成较大的错误拒绝率,从而影响正确识别率;而本文中提出的二次分类方法可以将在利用超椭球神经网络识别时产生的“问题样本”送入二次分类器中进行再分类,从而使总的正确识别率得到提高。基于超椭球神经网络和纠错SVM分类器的二次识别方法同时具备了它们各自的优点,并能在一定程度上克服二者的缺点,能够得到更高的正确识别率。而且由于第二次分类采用的是纠错Svl讧方法,所以总的错误拒识率为0,而且错误接受率也得到降低。总的来看,这种二次分类方法有着更高的正确识别率,因而取得了“一加一大予二”的效果。4l基于神经网络的人脸识别算法研究5总结与展望人脸识别系统是一种基于图像信息处理的模式识别系统,它主要包括人脸图像的特征提取和模式识别两大部分。特征提取部分是从人脸图像中提取能够反映不同人的人脸差别的有效信息:模式识别部分是对于提取的信息进行模式分类。这两部分的关系是采用级联的形式,最终的分类结果由这两部分共同决定。本文的主要工作如下:(1)对于特征提取部分,本文采用的是PCA方法和Fisher脸方法。PCA方法采用了图像压缩中的一种正交变换一KL变换,这种变换从能量压缩的角度是最优的。使用PCA方法能得到正确识别率只有90%左右,这是因为PCA方法虽然是一种很好的人脸描述方法,但不一定是最好的判别方法。而Fisher脸方法的基本思想是将原来高维的模式样本投影到最佳鉴别向量空间,从而使投影后的模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式样本在新的空间有最佳的可分性,因此它是一种有效的模式分析技术。实验结果也表明Fisher脸方法有着比PCA方法更好的识别效果。(2)对于模式识别部分,本文分别采用了基于仿生(拓扑)模式识别的超椭球神经网络方法和纠错SVM分类方法。纠错SVM分类方法由于利用了通信中的信道差错控制编码技术,因而具有了一定的纠错能力,这样即使几个二类分类器产生了错误的输出结果,但由于具有纠错机制,这些错误对最终的分类不产生影响,仍然可以得到正确的分类结果,因此这种分类器具有更好的分类效果。实验结果也表明,具有纠错能力的SVM分类器的识别效果明显高于最近邻分类器,但由于它的分类原理是对整个样本空间的划分,所以它也会不可避免地产生误识现象。实验结果表明,虽然纠错SVM方法的正确识别率相对较高,但它仍有着一定的错误识别率。而超椭球神经网络方法是仿生模式识别理论的应用,与把不同类样本在特征空间中的划分作为目标不同,它以一类样本在特征空间的分布的最佳覆盖作为目标,因此它对未训练样本有着很低的错误接受率(几乎为o)。但由于它的覆盖范围有限,所以可能会有检验样本不被任何类的样本空间所覆盖,从而造成拒识;同时也有可能某个检验样本被两类或两类以上的样本空间所覆盖,因此无法得到最终的分类结果,此时同样认为该样本被拒识。实验结果表明超椭球神经网络的错误拒识率对总的识别率有较大的影响。(3)前面所描述的超椭球神经网络分类方法对未训练样本的误识率极低,也就是说它所能识别的样本的正确率几乎为100%,但它的错误拒绝率却较高。因此本文提出了一种二次分类方法,将使用超椭球神经网络进行第一次识别后出现的“问题样本”放入二次分类器中进行再分类,从而得到了更好的识别效果。此后本文将超椭球神经网络和具大连理工大学硕士学位论文有纠错能力的SVM分类器相结合,得到了一种具有更好识别效果的分类器。它在对未训练样本取得较低误识率的同时,也取得了较高的正确识别率。实验结果表明,采用这种基于超椭球神经网络和纠错SVM分类器的二次分类方法可以其它任何一种单一分类器更好的识别效果。本文提出的二次分类方法取得了相对较好的分类效果,但是仍然有一些需要改进的地方:(1)虽然基于超椭球神经网络和纠错SVM分类器的二次分类方法有着相对较高的识别率,但由于它要分别训练超椭球神经网络和纠错SVM分类器,以及进行二次识别过程,所以其计算量也相对较大;(2)对于人脸库中未出现的样本,本文并没有对它们进行检验。而在实际中对于人脸库中没有的新类别样本的处理应该是首先对其拒绝识别,若同一个新类别的人脸样本多次出现,则产生一个新的类别,并将其纳入人脸库中,这是未来要研究的问题;(3)本文使用的特征是比较常见的PCA特征和Fisher脸特征,如果采取更为复杂的特征提取方法来得到特征可能会得到更高的正确识别率。而二次分类方法中二次分类器的选取也会对最终的分类效果产生一定的影响;一般来说,单一分类效果较好的分类器作为二次分类器可能获得较好的最终分类效果,这些都是值得研究的问题。目前,人脸识别技术基本上还是处于实验室阶段,但相信随着图像处理、模式识别、计算机视觉以及神经网络等学科的进一步发展,人脸识别技术必将会有更加深入的发展和广阔的应用前景。基于神经网络的人脸识别算法研究参考文献[1]陈绵书,陈贺新,桑爱军.计算机人脸识别技术综述.吉林大学学报(信息科学版).2003,21(5):101—109.[2]周杰,卢春雨,张长水等.人脸自动识别方法综述.电子学报.2000。28(4):102—106.[3]周激流,张哗.人脸识别理论研究进展.计算机辅助设计与图形学学报.1999,11(2):180-184.[4]ZhouJL.Astudyonautomaticrecognitionsystemforhumanprofile.JournalofSichuanUniversity(Natural[5]KanadScienceEdition),1994,31(1):100—104.computerandrecognitionofT.Pictureprocessingsystembyhumanface.PhDDissertation.Kyoto:KyotoUniversity。1973.[6]YanganalysiSMH.KiregmanDJ,AhuiaN.DetectingFaces:ASurvey.IEEETransactionsonpatternandmachineintelligence。2002,24(1):34—58.B.Vital[7]Millersignsofidentity.IEEESpectrum,1994。31(2):22—30.a[8]DaugmanJG.HighconfidencevisualrecognitionofpersonsbyTransactionsontestofstatisticalIntelligence,1993,independence.IEEEPattern^nalysisandMachine15(1):1148—1161.[9]SumalA,IyengarAP.Automaticrecognitionandanalysisofhumanfacesandfacialexpressionssurvey.PatternRecognition,1992,25(1):65—77.[10]刘艳丽,赵跃龙.人脸识别技术研究进展.计算机工程.2005,31(3):10-12.n1]梁路宏,艾海舟.人脸检测研究综述.计算机学报.2002,25(5):449-458.[12]CaiJ,Goshtasby凡Detectinghuman1999。18(1):63—75.[13]TurkMA,PentlandA.EigenfacesforRecognition.Journaloffaceincolorimages.ImageandVisionComputer,CogntitiveNeuro-Science,1991,3(1):71-86.[14]BelhumeurclassspecificPN,HespanhaJP,DavidJK.EigenfacelinearVS.Fisherfaces:recognitionusingprojectiomIEEETransonPAMI,1997,19(7):711—720.Matching,andNeural[153ZhangJ,YanY,LadeslLtheFacerecognition:Eigenface,ElasticNets.ProceedingsofIEEE,1998。85(9):1422—1435.It6]边肇祺,张学工等.模式识别.北京:清华大学出版社,1999.[17]Kim1tC。KimDJ。SungYBeta1.Facerecognitionusingthesecond—ordermixture—of-eigenfaces[18]SvetsOnmethod.PatternRecognition2004,37(8):337-349.DL,John矾Usingdiscriminanteigenfeaturesforimageretrieval.IEEETrans.PAMI,1990,18(8):831-836.[19]高秀梅,杨静字,杨键.基于复空间中K—L变换的人脸识别.计算机应用.2003,23(7):15一17.[20]LiuQS,LuHQ。MaSTrans.onD.ImprovingKernelFisherDiscriminantAnalysisforfacerecognition.IEEEPAMI,2004。14(1):42—49.大连理工大学硕士学位论文[213LoogKDuinRP,UmbachRlLMalticlassLinearDimensionreductionbyweightedpairwisefishercriteria.IEEETrans.OilP枷I。2001,23(7):762—766.【22]余冰,陈连甫,杜平.利用标准化LDA进行人脸识别.计算机辅助设计与图形学学报.2003。15(3):302-306.[23]MengJE,■uSQ,LuJtFaceRecognitionUsingRadialBasisFunctionNeuralNetworks.IEEETransonNeuralNetwork。2002,13(3):697—710.FaceRecognition:AConvolutionalNeuralNetworkApproach.[24]SteveL,GilesCL,TsoiACIEEETransonNeuralNetworks,1997。8(1):98—113.[25]LinonSII,Kung8Y,LinLL.FaceRecognition/DetectionbyProbabilisticDecisionBasedonNeuralNetwork.IEEETransNeuralNetwork.1997。8(1):114—132.t26]韩柯,王汇源.基于主元分析和神经网络的人脸识别方法.山东大学学报.2004,34(2):55—58.[27]GuoGD,StanzL,KaplukCFaceRecognitionandbySupportVectorll卸chines.IEEEInternational196—201.ConferenceOn^utomaticFaceGestureRecognition,Grenoble,2000:[28]KeerthiMachineSS.ConvergenceofageneralizedSMOalgorithmforSVMclassifierdesign.Learning,2002。46(1):351—360.zH,MoHY。LuHXeta1.AmethodofBiomimeticPatternon[29]WangrecognitionforfacerecognitiomProceedingsoftheInternationalJointConference2003:2216-2221.NeuralNetworks,Oregon,[30]wangSJ,ChenX.Biomimetic(Topological)PatternRecognition-AnewModelofPatternRecognitiononTheoryandItsApplication.ProceedingsoftheInternationalJointConferenceNeuralNetworks,Oregon,2003:2258-2262.SJ’Chen】(’QinHeta1.DoubleSynapticWeightNeuronTheoryandItsApplicatiomon[31]WangTheFirstInternationalConferenceNeuralComputation,Changsha,2005:264—272.[32】王守觉,李兆洲,陈向东等.通用神经网络硬件中神经元基本数学模型的讨论.电子学报.2001,29(5):577—580.[33]王守觉,徐健,王宪保等.基于仿生模式识别的多镜头人脸身份确认系统研究.电子学报.2003。31(1):I-3.[34】王守觉,曲延锋,李卫军等.基于仿生模式识别与传统模式识别的人脸识别效果比较研究.电子学报.2004,32(7):1057一1061.[35]Allwein,SingerY.ReducingMalticlasstoBinary:AunifyingApproachtoMarginClassifiers.JournalofMachineLearningResearch.2001,1(4):113—141.ControlCoding:FundamentalsandApplications.NewJersey:[36]Lin。CostelloDJ.ErrorPrentice-Ball.1983:48—49.[37]MoghaddamB。Pentland丸Beyondlineareigenfaces:Bayesianmatchingforfacerecognition.Proc.of230—243.Intl,conf.onAutomaticFaceandGestureRecognitio玛Nare.1998:45基于神经网络的人脸识别算法研究[38】LiuC工EnhancedIndependentcomponentanalysisanditsapplicationtocontentbasedfaceimage.IEEETrans.onSystems,manandcybemetics,Hague,2004:1117—1127.a[39]KimTl【’KimH玑hhrangwJeta1.Independentcomponentanalysisinonfaciallocalresiduespace.IEEEComputerSocietyConferenceNewYork,2003:579—586.ComputerVisionandPatternRecognition,[40]MarianIEEETransSB,JavierRl‘’TerrenceJS.FacerecognitionbyIndependentComponentAnalysis.onNeuralNetworks,2002,13(3):1450-1464.andapplications.IEEE[41]Hyv五xine几Independentcomponentanalysis:algorithmsOilTransNeuralNetworks。2000,3(6):411-430.MS.Faceimage[42]BartlettanalysisbyunsupervisedlearningandredundancyreductiomPhi)Dissertation.California:UniversityofCalifornia.1998.[43]SmmonJt[44]FoleyAnOptimalDiscriminantPlane.IE髓Trans.Computer,1970,19(9):826—829.0H。SammonJ飘AnOptimalSetofDiscriminantvectors.IEEETrans.Computer,1975,24(3):281-289.[45]EtemudK。ChellapaILonFacerecognitionusingdiscrimiannteigenvectors.IEEEInternational2148-2151.ConferenceAcoustics,SpeechandSignalProcessing,Atlanta,1996,[46]DaubechiesI.Orthonormalbasesofcompactlysupportedwavelets.SI^lIJournalonMathematicalAnalysis。1993,24(2):499—519.[47]李国正,王猛,曾华军.支持向量机导论.北京:电子工业出版社.2004.[48]SimonH.Neuralnetworks:Acomprehensivefoundation(secondedition).NewJersey:PrenticeHall,1999.[49]王成波.计算机人脸识别技术的研究.硕士学位论文.大连:大连理工大学,2005.[50]程云鹏.矩阵论(第二版).西安:西北工业大学出版社,2003.[51]WangCB,GuoCA.AsvMClassificationAlgoTithmwithErroronCorrectionAbilityAppliedtoFaceRecognition.InternationalSymposiumNeuralNetworks.Chengdtl,2006:1057一1062.[52]SebaldDJ,BucklewJ尢Supportvectormachinesandmultiplehypothesistestproblem.IEEETrans.onSignalProcessing,2001,49(11):2856-2872.et[53]Schakopr,Burges,SmolaCambridge:MITPress,1999.a1.AdvancesinKernelMethods:SupportVectorLearning.大连理工大学硕士学位论文攻读硕士学位期间发表学术论文情况[1]袁崇涛,郭成安.基于超椭球神经网络和可纠错支持向量机的二次分类方法在人脸识别中的应用.大连理工大学研究生网络学刊,2006.12.学位论文第二章,第三章,第四章.基于神经网络舸入脸识别算法研究致谢本论文是在导师郭成安教授的悉心指导下完成的,从选题、研究、实验,直至论文的最后完成,其中任何一点成绩的取得都离不开郭老师的关怀和点拨。在两年多的研究生生活中,郭老师不仅在学习上对我们耐心指导、严格要求,而且在生活上也给我们很多关心、理解和帮助。郭老师平易近人的生活作风、渊博的学识以及严谨的治学态度将使我终身受益。在此向郭老师致以最真诚的感谢。在两年多的研究生生活中,还得到了李建华老师对我的指导和帮助,在此也致以最真挚的谢意。另外,还要感谢同教研室的所有同学,他们共同给我提供了良好的学习和生活环境。特别是王涛、刘保卫、陈力、刘洋、姚莹、于大雷等几位同学,在两年多的同窗生活中,他们给予了我许多无私的帮助和快乐的回忆。也要感谢已经毕业的师兄师姐们的帮助,特别是王成波和王永辉两位师兄给我的指导和帮助。特别感谢多年来一直关爱和支持我的父母、亲友,他们的无私奉献是我永远难以报答的。最后,向支持和帮助过我的所有人表示谢意。袁崇涛2006年12月lO日48基于神经网络的人脸识别算法研究
作者:
学位授予单位:
袁崇涛
大连理工大学
1.陈绵书.陈贺新.桑爱军 计算机人脸识别技术综述 2003(05)
2.周杰.卢春雨.张长水.李衍达 人脸自动识别方法综述[期刊论文]-电子学报 2000(4)3.周激流.张晔 人脸识别理论研究进展[期刊论文]-计算机辅助设计与图形学学报 1999(2)4.Zhou J L A study on automatic recognition system for human profile 1994(01)5.Kanad T Picture processing system by computer and recognition of human face 19736.Yang M H.Kiregman D J.Ahuia N Detecting Faces:A Survey 2002(01)7.Miller B Vital signs of identity 1994(02)
8.Daugman J G High confidence visual recognition of persons by a test of statistical independence1993(01)
9.Samal A.Iyengar P Automatic recognition and analysis of human facesand facial expressions:A survey 1992(01)
10.刘艳丽.赵跃龙 人脸识别技术研究进展[期刊论文]-计算机工程 2005(3)11.梁路宏.艾海舟.徐光档.张钹 人脸检测研究综述[期刊论文]-计算机学报 2002(5)12.Cai J.Goshtasby A Detecting human face in color images 1999(01)13.Turk M A.Pentland A Eigenfaces for Recognition 1991(01)
14.Belhumeur P N.Hespanha J P.David J K Eigenface vs.Fisherfaces:recognition using class specificlinear projection 1997(07)
15.Zhang J.Yan Y.Lades M Face recognition:Eigenface,Elastic Matching,and Neural Nets 1998(09)16.边肇祺.张学工 模式识别 1999
17.Kim H C.Kim D J.Sung Y B Face recognition using the second-order mixture-of-eigenfaces method2004(08)
18.Svets D L.John W Using discriminant eigenfeatures for image retrieval 1996(08)19.高秀梅.杨静宇.杨健 基于复空间中K-L变换的人脸识别[期刊论文]-计算机应用 2003(7)
20.Liu Q S.Lu H Q.Ma S D Improving Kernel Fisher Discriminant Analysis for face recognition 2004(01)21.Loog M.Duin R P.Umbach R H Multiclass Linear Dimension reduction by weighted pairwise fishercriteria 2001(07)
22.余冰.金连甫.陈平 利用标准化LDA进行人脸识别[期刊论文]-计算机辅助设计与图形学学报 2003(3)23.Meng J E.Wu S Q.Lu J W Face Recognition Using Radial Basis Function Neural Networks 2002(03)24.Steve L.Giles C L.Tsoi A C Face Recognition:A Convolutional Neural Network Approach 1997(01)25.Lin S H.Kung S Y.Lin L L Face Recognition/Detection by Probabilistic Decision Based on NeuralNetwork 1997(01)
26.韩柯.王汇源 基于主元分析和神经网络的人脸识别方法 2004(02)
27.Guo G D.Stan Z L.Kapluk C Face Recognition by Support Vector Machines 2000
28.Keerthi S S Convergence of a generalized SMO algorithm for SVM classifier design 2002(01)
29.Wang Z H.Mo H Y.Lu H X A method of Biomimetic Pattern recognition for face recognition 200330.Wang S J.Chen X Biomimetic(Topological)Pattern Recognition-A new Model of Pattern RecognitionTheory and Its Application 2003
31.Wang S J.Chen X.Qin H Double Synaptic Weight Neuron Theory and Its Application 2005
32.王守觉.李兆洲.陈向东.王柏南 通用神经网络硬件中神经元基本数学模型的讨论[期刊论文]-电子学报 2001(5)33.王守觉.徐健.王宪保.覃鸿 基于仿生模式识别的多镜头人脸身份确认系统研究[期刊论文]-电子学报 2003(1)34.王守觉.曲延锋.李卫军.覃鸿 基于仿生模式识别与传统模式识别的人脸识别效果比较研究[期刊论文]-电子学报 2004(7)
35.Allwein Singer Y Reducing Multiclass to Binary:A unifying Approach to Margin Classifiers 2001(04)36.Lin Costello D J Error Control Coding:Fundamentals and Applications 1983
37.Moghaddam B.Pentland A Beyond linear eigenfaces:Bayesian matching for face recognition 199838.Liu C J Enhanced Independent component analysis and its application to content based face image2004
39.Kim T K.Kim H W.Hwang W J Independent component analysis in a facial local residue space 200340.Marian S B.Javier R M.Terrence J S Face recognition by Independent Component Analysis 2002(03)41.Hyv?rine A Independent component analysis:algorithms and applications 2000(06)
42.Bartlett M S Face image analysis by unsupervised learning and redundancy reduction 199843.Sammon J W An Optimal Discriminant Plane 1970(09)
44.Foley D H.Sammon J W An Optimal Set of Discriminant vectors 1975(03)45.Etemad K.Chellapa R Face recognition using discriminant eigenvectors 199646.Daubechies I Orthonormal bases of compactly supported wavelets 1993(02)47.李国正.王猛.曾华军 支持向量机导论 2004
48.Simon H Neural networks:A comprehensive foundation 199949.王成波 计算机人脸识别技术的研究[学位论文]硕士 200550.程云鹏.张凯院.徐仲 矩阵论 2003
51.Wang C B.Guo C A A SVM Classification Algorithm with Error Correction Ability Applied to FaceRecognition 2006
52.Sebald D J.Bucklew J A Support vector machines and multiple hypothesis test problem 2001(11)53.Schakopr.Burges.Smola Advances in Kernel Methods:Support Vector Learning 1999
1.学位论文 孟蕊 基于Gabor特征的二次分类法在人脸识别中的应用 2007
人脸识别是模式识别和图像处理领域最前沿的研究课题之一,由于其在司法、公安、安全等领域有着广泛的应用前景,近年来人脸识别受到了广泛的关注。
人脸识别问题涵盖了计算机视觉、神经网络、数字图像处理和模式识别等众多学科,它主要分为三个部分:人脸检测、特征提取和分类器的设计,本文主要研究特征提取和分类器设计两个部分,特征提取是从人脸图像中提取可以用来分类的信息;而分类器的设计部分是利用提取的特征进行识别分类。
本文提出一种基于Oabor特征的二次分类方法,在该方法中对于特征提取部分,采用的是Gabor特征;对于分类器部分,采用了结合仿生模式识别与纠错SVM的二次分类器。本文做了大量的仿真实验,在特征提取部分将Gabor特征与主成分分析法和Fisher脸方法进行对比,分类器部分与最近邻、仿生模式识别、纠错SVM进行比较,二维Gabor函数可以较准确的描述人脑视觉皮层简单细胞的感受野;二次分类器将基于仿生模式识别理论的超椭球神经网络方法与具有纠错能力的SVM方法结合起来,首先使用超椭球神经网络进行第一次分类得到中间结果,再将拒识、多识样本放入具有纠错能力的SVM中进行二次分类。这种方法兼具仿生模式识别和纠错SVM的优点,并可以克服对未训练样本的误识率高的问题,同时也具备纠错SVM方法的纠错能力。因而将Gabor特征与二次分类器相结合具有更好的分类效果。在Cambridge ORL,Yale和AR太阳镜人脸子库,AR围脖人脸子库的仿真实验结果表明,以Gabor特征为输入矢量,应用二次分类方法进行图像识别,正确识别率分别达到了99.75%、99.001%、97.9%、97.62%。
2.学位论文 莫良永 基于GPU的并行人脸识别算法研究 2008
人脸识别是模式识别和图像处理领域最前沿的研究课题之一。由于其在司法、公安、安全等领域有着广泛的应用前景,近年来人脸识别受到了广泛的关注。
另一方面,近年来图形处理器(GPU)高速发展,提高了计算机图形处理的速度,并促进了与计算机图形相关应用领域的快速发展。与此同时,图形处理器绘制流水线的高速度和并行性以及近年来发展起来的可编程功能为图形处理以外的通用计算提供了良好的运行平台,这使得基于GPU的通用计算成为近两三年来人们关注的一个研究热点。
在本文的人脸识别研究中,应用了基于Gabor特征的二次分类方法。该方法中对于特征提取部分,采用的是Gabor小波特征;对于分类器部分,采用了结合仿生模式识别与纠错SVM的二次分类器。二次分类器将基于仿生模式识别理论的HENN方法与具有纠错能力的SVM方法结合起来,首先使用HENN进行第一次分类得到中间结果,再将拒识、多识样本放入具有纠错能力的SVM中进行二次分类,达到了非常高的识别率。但是在Gabor特征提取、超椭球神经网络(HENN)和支持向量机的训练上所花费的时间比较长,对于40个人的ORL人脸库,整个人脸识别系统的训练时间在15分钟左右,对更大型的人脸库(如AR人脸库)时间长达40分钟左右。
针对二次分类法人脸识别系统需要大量的训练时间的不足,本文提出了一种基于GPU并行原理的算法,充分利用GPU并行计算的优势,分别在人脸Gabor特征,超椭球神经网络和支持向量机的训练检验上对算法进行了改进,使之适合于GPU并行计算的优点,将训练和识别过程转化为GPU纹理并行渲染过程,在不影响识别率的前提下,获得了较好的加速效果。
本文链接:http://d.g.wanfangdata.com.cn/Thesis_Y1030138.aspx
授权使用:哈尔滨工业大学(hebgydx),授权号:9ee8abae-a449-4fbb-a3e3-9e0700d18aca
下载时间:2010年10月6日
因篇幅问题不能全部显示,请点此查看更多更全内容