第1章 人脸检测
1.1 背景
人脸检测问题最初来源于人脸识别,任何一个自动的人脸识别系统首先必须对人脸进行准确的定位,因此实时而有效的人脸检测显得尤为重要。跟其他生物特征识别方法相比,人脸识别具有更加直接、方便、友好的特点,因其非侵犯性更容易被用户所接受。而且,通过对人脸的表情、姿势等作分析,还能获得其他识别系统难以获得的信息,因此人脸识别成为最有潜力的生物身份验证手段。早期的人脸识别研究主要针对具有较强约束条件的人脸图像(如无背景的图像),因此假设人脸容易获得或在手工交互下运用,而人脸检测问题并未得到重视。
近年来,随着信号处理理论和计算机的出现及其发展,人们开始用摄像机获取环境图像并将其转换成数字信号,用计算机实现对视觉信息的处理,这就形成了计算机视觉。计算机视觉是当前计算机科学中的一个非常活跃的领域,其基本假设是:可以用计算的方式来模拟人类的视觉机制。
人脸的自动识别是一种重要的生物特征识别技术,与其它身份识别方法相比,人脸识别具有直接、方便、友好等特点,因而人脸自动识别问题的研究不仅具有重要的应用价值,而且具有重要的理论意义。现在,随着科学技术和电子商务的发展,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、计算机视觉、人机交互等方面都有着重要的应用价值。
人脸识别通过计算机提取人脸的特征,并根据这些特征进行身份验证。人脸与人体的其他生物特征(指纹、虹膜等)一样与生俱来不可改变,它们所具有的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,同其他生物特征识别技术相比,人脸识别技术具有操作简单、结果直观、隐蔽性好的优越性。人脸识别一般包括三个步骤:人脸检测、人脸特征提取和人脸的识别与验证。其处理流程如图1-1所示。
人脸 检测 特征 提取 身份识别验证 输入图像 人脸图像 人脸特征 输出结果
图1-1人脸识别的一般步骤
5
1.2 目前的研究状况
人脸检测是一个复杂的极具挑战性的模式检测,其主要的难点有两方面:一方面是由于人脸内在的变化所引起:
(1)人脸具有很复杂的细节变化,不同的外貌特征如脸形、肤色等,不同的表情如眼、嘴的开与闭等;
(2)其他物体对人脸的遮挡,如眼镜、头发和头部饰物以及其他外部物体等; 另外一方面由于外在条件变化所引起:
(3)成像角度的不同也能造成人脸的多姿态,如平面内旋转、深度旋转以及上下旋转,其中深度旋转影响较大;
(4)光照的影响,如图像中的亮度、对比度的变化和阴影等;
(5)图像的成像条件,如摄像设备的焦距、成像距离,图像获得的途径等等。 这些困难都为解决人脸问题造成了难度。如果能找到一些相关的算法并使其能在应用过程中达到实时,将为成功构造出具有实际应用价值的人脸检测系统提供保证。
目前,国外对人脸检测问题的研究有很多,比较著名的有MIT,CMU等;国内的清华大学、北京工业大学、中科院计算所和自动化所等都有人员从事人脸检测相关的研究。而且,MPEG7标准组织已经成立了人脸识别草案小组,人脸检测算法也是一项征集的内容。随着人脸检测研究的深入,国际上发表的有关论文数量也在大幅度增长,如IEEE的FG、ICIP\\CVPR等重要国际会议上每年都有大量关于人脸检测的论文,占有关人脸研究论文的1/3之多。由此可见世界范围的学者对人脸检测技术的重视。
1.3 概念
人脸检测是指对于任意一幅给定的图像,采用一定的策略进行搜索来确定其中是否含有人脸,如果是,就返回人脸的位置、大小和姿态。
人脸检测是自动人脸识别系统中的一个关键环节。随着电子商务等应用的发展,人脸识别成为最有潜力的生物身份验证手段,这种应用背景要求自动人脸识别系统能够对一般图像具有一定的识别能力,由此所面临的一系列问题使得人脸检测开始作为一个独立的课题受到研究者的重视。现在,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视频检测等方面有着重要的应用价值。
1.4 人脸检测及其合成技术的应用领域
近年来,视频人脸检测及其合成技术受到越来越多研究者的关注,这主要由于两方
6
面原因:一方面,计算机计算和存储成本的大幅度下跌使得以视频速率或近似视频速率采集存储图像序列成为可能;另一方面,视频跟踪识别技术的极为广阔的市场应用前景也是推动此研究的主要动力。主要应用在一下五个领域: (1)身份认证与安全防护
最通俗的例子就是门禁控制。门禁控制是为了有效的控制人员的出入,并且记录所有进出的详细情况,实现对出入的安全管理。人脸门禁系统是一种基于人脸识别技术的新型访问控制系统,将具有访问权限的访问者的人脸信息存放在人脸数据库中,对人脸信息进行学习训练。通过摄像机动态捕获人脸,将人脸信息同数据库中人脸信息进行检索比对,只有图像信息符合的人才可以进入,否则拒绝进入,并对强行进入者发出报警。
在这个世界上,只要有门的地方几乎都带有一把锁。当然,在许多安全级别要求较高的区域,例如金融机构、机关办公大楼、运动场馆、甚至重要设施的工地,都需要对大量的人员进行基于身份认证的门禁管理。手机、笔记本电脑等个人电子用品,在开机和使用中经常要用到身份验证功能。 (2)媒体与娱乐
人们的许多娱乐活动都是跟脸部有关的。最著名的娱乐节目之一就是川剧的变脸。在网络虚拟世界里,通过人脸的变化,可以产生大量的娱乐节目和效果。手机、数码相机等消费电子产品中,基于人脸的娱乐项目越来越丰富。QQ、MSN等即时通信工具以及虚拟化身网络游戏也是人脸合成技术的广阔市场。
另外还有家庭娱乐。家庭娱乐是指能够识别主人身份的智能玩具,家政机器人,具有真实面像的虚拟游戏玩家等。随着电子技术水平的提高,家庭娱乐会得到广泛的应用,其中的关键技术之一也是人脸的跟踪识别。 (3)图像搜索
目前,Google的图像搜索其实还是文字搜索。基于人脸图像识别技术的搜索引擎将会具有广泛的应用前景。 (4)协助调查
目前,在银行、金库发生抢劫事件已经屡见不鲜。发生这样的事件不是一时就能够制止的,但是可以通过人脸检测的设备来提取并记录罪犯的人脸,提供给公安机关以帮助破案。
(5)信息安全
信息安全是指计算机和网络的登录、文件的加密和解密。在信息安全中,人脸的识别也是其中的一个关键技术。
1.5 人脸检测评价标准
人脸检测系统性能主要评价标准有:检测率,误检率,检测速度以及鲁棒性:
7
(1)检测率
被正确检测到的人脸数与图像内包含的人脸数的比值。检测率越高,说明检测系统对人脸的接受能力越强。 (2)误检率
也称虚警率,误报率。被误检为人脸的非人脸子窗口数与图像内被检测的所有非人脸子窗口数的比值。设图像内被检测的所有非人脸子窗口数为N2,被误检为人脸的非人脸子窗口数为从,则误检率为Nl/N2。再设图像内被检测的所有子窗口数为N,图像内包含的人脸数为Nl,N=Nl。当N>Nl时,误检率近似于Nl/N。
检测率无法反映系统对非人脸的排除能力,有可能出现这种情况:所有人脸都被检测到,但同时很多非人脸区域被误认为是人脸。因此引入误检率来衡量系统对非人脸的排除能力。误检率越低,说明检测系统对非人脸的排除能力越强。 (3)检测速度
大部分应用领域需要在线实时地检测人脸,如人脸识别、人脸跟踪,视频监控等。在检测率和误检率达到满意的前提下,检测速度越快越好。 (4)鲁棒性
即在各种条件下,检测系统的适应能力。如复杂背景的干扰,人脸姿态的影响,光照条件的影响,以及遮挡等因素的影响。
这四个标准有些是相互制约的,比如误检率随着检测率的提高而提高,检测率随着误检率的降低而降低。
8
相关推荐: