JournalofTsinghuaUniversity(Sci&Tech)16/26
第3期第67~70页 基于K-L变换的人脸自动识别方法*
彭 辉, 张长水, 荣 钢, 边肇祺
清华大学自动化系;智能技术与系统国家重点实验室,北京100084
文 摘 研究了利用计算机实现的人脸自动识别方法。在传统的“特征脸”方法基础上,提出了一种改进的人脸自动识别方法。该方法对于经过预处理的标准人脸图像,以类间散布矩阵为产生矩阵,通过K-L变换降维并提取人脸图像的代数特征。同时,利用遗传算法进行特征选择,以构成有利于分类的自适应子空间。在此子空间内,将图像进行正交分解,然后分别对各类训练样本进行二次K-L变换,进一步构成其
旋转子空间,从而最终实现了一个分层次的最小距离分类器。实验表明,本方法识别率较高,且对于人脸的姿态、表情及光照条件均具有一定的不敏感性。
关键词 人脸自动识别;K-L变换;遗传算法;子空间分类号 TP391.41
需要对人脸图像进行一系列的预处理,以达到位置校准、灰度归一的目的。1.1 图像校准
假定已根据分割及定位算法得到了人脸正面图像左、右两眼中心的位置,并分别记为Er和El,则可通过下述步骤达到图像校准的目的:
1)进行图像旋转,以使Er和El的连线ErEl保持水平。这保证了人脸方向的一致性,体现了人脸在图像平面内的旋转不变性。
人脸自动识别作为一种重要的个人身份鉴别方法,可广泛地应用于刑侦破案、证件核对、保安监视、通道控制乃至自动取款机(ATM)等多种场合。与利
用指纹、手掌、视网膜、虹膜等其他人体生物特征进行人身鉴别的方法相比,人脸识别具有直接、友好、方便的特点,特别是对于使用者无任何心理障碍。
W.Bledsoe以人脸特征点的间距、比率等参数为特征,建成了一个半自动的人脸识别系统[1]。人脸自动识别的研究分为两大类方法:1)以人脸器官的形状和结构关系等几何特征为基础的模型匹配法;2)是基于连接机制的神经网络学习法。介于二者之间的是利用图像代数特征的所谓“特征脸”(eigen-faces)方法。本文正是对这一方法的进一步讨论与发展。
[2]
图1 图像剪裁比例示意图
2)根据图1所示的比例关系,进行图像剪裁。图1中,设O点为ErEl的中点,且d=ErEl。经过剪
裁,在2d×2d的图像内,可保证O点固定于(0.5d,这保证了人脸位置的一致性,体现了人脸在d)处。
图像平面内的平移不变性。
3)进行图像缩小/放大变换,得到统一大小的校准图像。规定校准图像的大小为128×128像素点,则缩放倍数为U=2d/128。这使得d=现了人脸在图像平面内的尺度不变性。1.2 灰度归一
先对校准图像做灰度拉伸,以改善图像的对比度。然后采用直方图修正技术使图像具有统一的均ErEl为
定长(64个像素点),即保证了人脸大小的一致性,体
1 人脸图像的预处理
对于一个全自动的人脸自动识别系统,其首要工作是人脸图像的分割以及主要器官的定位。另外,
由于本文所采用的基于K-L变换的方法在本质上依赖于图像灰度在空间分布上的相关性,故还特别
收稿日期:1996-06-10
第一作者:男,1970年生,博士研究生 *国家“八六三”高技术项目,863-306-03-01-3
68
清华大学学报(自然科学版)1997,37(3)
值和方差,以部分地消除光照强度的影响。
经过上述一系列预处理,得到了所谓的“标准图像”。以下的识别过程便都是对于标准图像进行的。
满足 X=U∑
12V
T
(1)
TT
其中:λi(i=0,1,…,r-1)为矩阵XX和XX的非
2 基于K-L变换的代数特征提取
K-L展开是图像压缩的一种最优正交变换。人们将其应用于特征提取,形成了子空间法模式识别的基础。在人脸自动识别领域,文[3]将K-L展开用于人脸图像的最优表示。随后,文[2]提出了“特征
脸”方法。
该方法以训练样本集的总体散布矩阵为产生矩阵,即
St=E{(x-m)(x-m)T}
i, i=0,1,…,P-1x∈ k
零特征值,ui和vi分别为XXT与XTX对应于λi的特征矢量。上述分解称为矩阵X的奇异值分解(SVD),
推论
λi为X的奇异值。
U=XV∑
由于Sb可表示为
1TSb=P∑(mi-m)(mi-m)=
i=0
1XXT∈P
其中
X=[(m0-m),…,(mp-1-m)]∈故,构造矩阵
R=XTX∈
P-1
-12(2)
R
N×N
22
或
St=
1T
(xi-m)(xi-m)∑Mi=0
M-1
R
N×P
2
其中xi为第i个训练样本的图像矢量,m为训练样
本集的平均图像矢量,M为训练样本的总数。经过K-L变换,可以得到相应的一组特征矢量,称之为“特征脸”;有了这样一个由“特征脸”张成的降维子空间,任何一幅人脸图像都可以向其做投影并获得一组坐标系数,这组系数表明了该图像在子空间中的位置,从而可以作为人脸识别的依据。本文则采用训练样本集的类间散布矩阵作为K-L变换的产生矩阵,即:
P-1i=0
容易求出其特征值λi及相应的正交归一特征矢量vi(i=1,2,…,P-1)。上述推论可知,Sb的正交归一特征矢量为
ui=
1λi
这就是所谓的“特征脸”图像矢量。它是通过计算较低维矩阵R的特征值与特征矢量而间接求出的。对于每个人的训练样本的平均图像矢量mi(i=
0,1,…,P-1),向由“特征脸”图像矢量所张成的P-1维子空间上投影,其坐标系数矢量就是其K-L变换的展开系数矢量,即:
ci=Umi, i=1,2,…,P-1
推知
C=UX=
T
T
R
P×P
Xvi, i=1,2,…,P-1(3)
Sb=
∑
i)(mi-m)(mi-m)P(ω
T
其中mi为训练样本集中第i个人的平均图像矢量,P为训练样本集中的总人数。显然,与总体散布矩阵St相比,“特征脸”的个数由M-1降低到P-1,因而Sb在计算量上要减少很多。同时,实验表明,识别率并没有下降。
为了求N×N维矩阵Sb的特征值和正交归一的特征矢量,直接计算几乎是不可能的。为此引出下列定理。
定理(SVD):
设X是一秩为r的n×r维矩阵,则存在两个正交矩阵:
U=[u0,u1,…,ur-1]∈V=[v0,v1,…,vr-1]∈以及对角阵
[4]
2
2
(4)
∑
12V
T
(5)
其中:C=[c1,c2,…,cp-1],ci为训练样本集中第i个人的特征系数矢量。显然,(5)式比(4)式在计算上要简便得多。
对于任一待识别样本f,亦可通过向“特征脸”子空间投影求出其系数矢量:
y=UTf
其重建图像
f=Uy
考虑重建图像的信噪比
f 2
RSN=10lg
f- f 2
若其小于阈值θ,则可判断f不是人脸图像。R
R
n×r
, UU=I
T
r×r
, VTV=I
∑
且
=diag[λ0,λ1,…,λr-1]∈
λ0≥λ1≥…λr-1
R
r×r
彭 辉,等:基于K-L变换的人脸自动识别方法
69
3 利用遗传算法进行特征选择
传统的方法认为应选择那些较大特征值所对应的特征矢量用于识别,即主分量特征;也有人提出应选择那些较小特征值所对应的特征矢量,即次分量
1≥2+1≥…的顺序特征;还有人认为应按λ1+λλλ12
选取对应的特征矢量。这里,我们提出采用遗传算法,通过对2P-1种“特征脸”选择方案的搜索来得到“特征脸”集合的一个最优子集。
设遗传算法中染色体位串长度为P-1,其每一位基因:若取值为1,表示选择该“特征脸”矢量;若取值为0,则表示不选择。由于绝大多数“特征脸”矢量都将被选择,故为了加快收敛,在产生初始种群时,可将位串中每一位取值为1的概率设定为0.9。
对于给定的染色体q,定义适值函数
f(q)=1∑∑W(x,i,q)
Pi=0x∈ki
其中
1, 若x被正确地分到第i类0, 若x未被分到第i类
这里,构造一个新的训练样本集,并采用简单的最近
W(x,i,q)=
邻准则进行分类。显然,适值f(q)的大小表示了染色体q在训练样本集上识别率的高低。
最后,按照简单遗传算法(SGA)[5]开始迭代搜索。其中采用的三个遗传算子:
1)选择算子:对于每一代种群,采用轮盘赌(roulette-wheel)的方法进行选择复制。即对于种群中每一染色体q,令其选择概率为
N-1
P-1
题就转化为l维坐标系数矢量的分类问题。
4 分层次的最小距离分类器设计
在自适应子空间内,为了更加精细地刻画每一个人的训练样本的分布情况,再对训练样本集中各类训练样本分别进行二次K-L变换,其产生矩阵选
为各类训练样本的协方差矩阵,即
∑
且
i
=1∑(y-ci)(y-ci)T,Miy∈ki
i=0,1,…,P-1
~T1i,ci=y=Ux,x∈kyMi∑y∈k
i
其中Mi为第i个人的训练样本集合ki中的样本数目。
通过K-L变换,可得到各类互不相同的最优表示坐标系,这相当于对原自适应子空间的坐标系分别进行了一次旋转变换,称之为各类的旋转子空间。
至此,可在这两重子空间内实现一个分层次的最小距离分类器。首先,在自适应子空间内,采用普通的最小距离分类器进行初分类。对于待识别的人脸图像f,有
~T
η=Uf
l-1
令di= η-ci =
∑
[Z(k)-ci(k)]2,
k=0
i=0,1,…,P-1
选取其中距离最小的5类作为候选人,然后分别向他们各自的旋转子空间投影(可选择那些较小特征值所对应的次分量进行投影),并计算到其类别均值的距离,再利用第二层最小距离分类器进行最终分类,分至距离最小的那一类。
Pq=f(q)
∑
i=0
f(i)
其中:N为种群规模。
如此一共进行N次,产生新的种群。
2)交叉算子:以随机方式将被选择出来的N个染色体两两配对,然后随机地选择一个交叉点,将配对的染色体中排列在该交叉点之后的基因按概率Pc(如0.8)进行互换。
3)变异算子:为避免算法早熟,还需对于每个染色体需按一定的变异概率Pm(如0.05)改变基因的位值。
按照上述步骤,进行迭代,直到某一代中的最优染色体满足识别率的要求或达到迭代次数的上限为止。这样,那些被选中的“特征脸”矢量组成了新的
N2×l
特征矩阵,记作:~U=[~u0,~u1,…,~ul-1]∈R。
经过特征提取和特征选择,得到了由l个“特征脸”矢量所张成的自适应子空间。至此,人脸识别问5 实验结果
在SGI工作站上对一个由每人15幅图像,共计18人组成小型数据库进行了实验。该数据库包括了在不同光照条件下拍摄的状态、表情以及到摄像机的距离各不相同的人脸正面图像。此外还有一些特例,如聚焦不准,部分遮挡,做怪脸等。
选取每人有代表性的6幅图像作为训练集(如图2所示)。其中,4幅图像用于计算“特征脸”,并与另2幅图像共同作为GA训练集和二次K-L变换的训练集。每人所余下的6幅图像则作为测试集。实验
结果如表1所示。70
清华大学学报(自然科学版)1997,37(3)
脸的姿态、表情及光照条件也具有一定的不敏感性。总之,通过对图像进行正交分解并在其子空间内进行识别是一个很有潜力的课题,其应用也不仅仅限于人脸自动识别问题。
参 考 文 献
1
图2 训练样本示例
2
表1 不同特征脸选择的识别率η×100
选择特征分类器1分类器2
全部“特征脸”主分量
86.1391.06
85.7189.36
次分量86.9791.18
GA选择89.5094.04
3
Bledsoe:22PRI
TurkM,PentlandA.Eigenfacesforrecognition.JournalofCognitiveNeuroscience,1991,3(1):71~86
SirovichL,KirbyM.Low-dimensionalprocedureforthecharacterizationofhumanfaces.JOptSocAmerA,1987,4(3):519~524
4奥亚E.子空间法模式识别.蔡国廉,杨文瑜译.北京:
科学出版社,19875
Goldberg
DE.
Genetic
AlgorithmsinSearch,
OptimizationandMachineLearning.USA:Addison-Wesley,Reading,Mass,1989
W.
Man-machine
facial
recognition.
PanoramicResearchInc,PaloAlto,CA,1966,Rep
实验中,对不同的“特征脸”选择方法进行了对比。结果表明:利用GA选择特征是十分有效的。需要指出的是,主分量特征、次分量特征以及通过GA选择的特征数目都是相同的。同时,也对两种不同的
分类器,即:在自适应子空间内采用的一般的最小距离分类器(称为分类器1)和进行二次K-L变换后在双重子空间内采用的分层次的最小距离分类器(称为分类器2),进行了比较,结果表明:后者对识别率的提高有明显作用。
-Researchofautomatedfacerecogni
-LtransformtionbasedonK
PengHui,ZhangChangshui,RongGang,BianZhaoqi
DepartmentofAutomation,TsinghuaUniversity;StateKeyLaboratoryofIntelligentTechnology
andSystemsBeijing100084
: AutomatedFaceRecognition(AFR)isoneofAbstract
themostchallengingtasksforcomputervisionandpatternrecognition.Basedonthetraditionaleigenfacesmethod,thispaperpresentsanimprovingapproachtoAFR.Forthosestandardfaceimages,regardingthebetween-class
scattermatrixasgeneratingmatrix,itextractsthealgebraicfeaturesoffaceimagesthroughK-Ltransform.Then,usingGeneticAlgorithm(GA)forfeatureselection,itconstructsanadaptivesubspacewherethetrainingsamplesofeachsubjectarecarriedoutorthonormalexpansionandconstitutetheirrotationsubspacesusingthesecondK-Ltransform.Finally,alayeredminimumdistanceclassifierisrealized.Experimentalresultsshowtheeffectivenessoftheapproachanditsinsensitivitytothefaceposture,expressionandilluminationconditions.
Keywords: automatedfacerecognition;K-Ltransform;
geneticalgorithm;subspace
图3 训练样本数N与识别率Z的关系
另一方面,由图3可以看出,随着每个人训练样本数的增加,识别率也逐渐提高。这与人本身的视觉识别能力是一致的。
此外,还看到一些特殊的样本,如戴眼镜,做怪脸等,也获得了正确的识别结果。同时,通过对错例的分析,则发现那些距摄像机较远的样本(如图2(f),以及那些在非图像平面内发生姿态变化的样本识别率较低。
6 结束语
本文算法在一定程度上提高了识别率,对于人
因篇幅问题不能全部显示,请点此查看更多更全内容