基于视频的人脸识别研究进展
5期严严等:基于视频的人脸识别研究进展
3.3小结
综上可以看出“视频一图像(多幅图像)”人脸识别和“视频一视频”人脸识别研究的主要问题包括:
(1)如何对高维的人脸图像降维;(2)如何对降维后的人脸序列进行描述;(3)如何刻画描述方式之间的度量;
人脸数据降维的目的是得到表达性特征(如主成分分析等)或鉴别性特征(如线性鉴别分析等)以降低高维人脸数据的计算复杂度和减弱噪声、表情、光照等因素的影响¨….对各种常见线性和非线性的降维方法研究的介绍可参考文献E5G.
现阶段对降维后的人脸序列描述方式包括矢量、矩阵、概率、动态模型、流形等.其中采用概率和流形的方法需要大量反映人脸分布的样本才能更准确地刻画人脸的分布,达到较好的性能.利用动态模型能够很好地利用时间和空间的信息,但是方法相对比较复杂,计算量一般都比较大.而利用矢量作为输入描述方式的主要缺点是样本选取的随机性.矩阵方式最为简单,并且可以应用到时间上不连续的多幅图像情况,但如何更好地刻画矩阵之间的度量是一个值得研究的内容.
4常用的视频人脸数据库及
一些实验结果
目前基于视频的人脸识别常用的视频人脸数据库包括Mobo(Motion
of
body)数据库[52]和Honda/
UCSD数据库阻91.Mobo数据库最初是CMU为了
Human
ID计划进行步态识别而采集的数据库.整
个数据库包含25个人在跑步机上以四种不同的方式行走的视频序列.行走的方式包括慢速行走、快速行走、斜面行走和拿球行走.正面角度拍摄的视频序列共99段(一段丢失).UCSD/Honda数据库包含20个人的共52段视频.数据库中的人脸视频包含了大规模的2D(平面内)和3D(平面外)的头部旋转.另外还有DXM2VTS数据库[5引.
这些视频人脸数据库普遍的缺点是没有考虑到各种条件的变化.大部分都是姿态的变化,其他的如光照、表情的变化等考虑较少,并且数据库的人偏少(<50个人),无法进行大规模有效的实验来评价各种算法的优劣.
目前大部分的文献中采用的数据库以及训练,测试方法都不尽相同.但为了对目前典型方法的实验结果有一个直观的认识,表4汇集了在视频人脸数据库上一些典型方法的实验结果.
万
方数据表4视频人脸数据库上典型方法的实验结果
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新人文社科基于视频的人脸识别研究进展(9)全文阅读和word下载服务。
相关推荐: