人脸识别如何更快更准—新闻

作者：李勤来源：中国科学报发布时间：2015/8/18 9:24:08

选择字号：小中大

“刷脸”易动态识别难

人脸识别如何更快更准

图片来源：百度图片

■本报见习记者李勤

“只要走进装有摄像头的咖啡厅，就会发现服务员已提前为你准备好最喜欢的咖啡；来到公司上班，智能迎宾机器人已自动打出带有你名字的欢迎语……”自马云向德国总理默克尔演示了“刷脸支付”后，人们对人脸识别技术就有诸多期待，甚至描绘了上述一些具体应用场景。

2008年北京奥运会将人脸识别技术用于安防，这成为人脸识别发展的一个标志性事件，2012年后，人脸识别技术的应用更是呈现出爆发式增长，近年来已应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等众多领域。

但是，我们真的要进入人脸识别时代了吗？或许这还没有人们想象中的那样快。

轨道交通视频与安全联盟名誉理事长、原铁道部运输局视频业务主管领导田裳指出，技术（算法）、设备与环境是人脸识别应用三个缺一不可的环节。

算法的三大进步

在迈向这个时代前，人脸识别在算法上已经取得了三大进步。

近日，生物识别产业技术创新联盟和轨道交通视频与安全联盟在中国科学院自动化所联合召开了2015人脸识别技术与行业应用研讨会。

据生物识别产业技术创新战略联盟副理事长、清华大学教授苏光大介绍，目前基于最佳二维人脸理论的单人单张人脸识别算法已经趋于成熟，基于单人多张人脸识别的算法却方兴未艾。在应用深度学习的人脸识别技术上已经实现了一大进步。香港中文大学采用深度学习方法在LFW（Labeled Faces in the Wild）人脸库上的识别率达到了99.15%。

第二个进步则是单张人脸图像的三维人脸重建，对视频监控下的动态识别贡献尤其大。因为人脸形状特征点提取技术的提高，使得三维人脸识别技术有了很大进步。此前，有的动态人脸识别系统对于获取的人脸图像要求是左右角度不超过15度，两眼间距大于30像素，但是大部分视频监控的人脸分辨率低于30像素，安保系统识别困难。第三个进步则是对这些超低分辨率人脸图像的重建与识别技术取得了一定进展。

在2014年美国国家标准技术局会举办的权威人脸识别技术供应商测评（FRVT）中，对平均人脸分辨率为67像素的VISA出入境申请照测试集进行测试，2万库的首选识别率排名最高的前三家公司是日本电气（NEC）、法国赛峰和日本东芝，识别率分别为98.3%、93.9%和91.8%。

苏光大认为，这已经是国际最先进水平，但是在国内某千万级的辨识系统招标中，要求首选识别率要达到95%就很难实现。“在2万库中最先进的水平是如此，在千万级的水平上，识别率只会线性下降，再加上我国身份证有效期限比较长，容貌在此期间改变较大，怎么能达到95%？这不是逼着厂商去做假？过高的要求在现阶段是不切实际的。”他强调。

苏光大认为，当前人脸识别技术面临的主要挑战在于：大姿态角（大于30度）、超低分辨率（人脸分辨率小于30像素）、大年龄跨度（5年以上）和深度学习人脸识别的广泛应用上。

受制于设备和环境的动态识别

这或许不能责怪人们对人脸识别的期望值过高。

2011年各铁路局建设了安检门系统，为人脸识别系统建设提供了基本的硬件条件，有些车站开始陆续上马人脸识别系统。田裳透露，此前铁道部在与NEC等人脸识别设备提供商接触时，大家都对视频动态的人脸识别表示出强烈的信心。

但是，2013年在进行人脸识别的视频测试时，测试结果却“辜负”了期望。

轨道交通视频与安全产业技术联盟参与了这次测试，测试结果在该研讨会上进行了发布。据该联盟参与测试的研究人员杨柳介绍，根据摄像机角度、光线、目标正面图像在视频中的滞留时间、目标同时出现的数量等把从测试车站获得的视频分成了A、B、C三类视频，其中A类视频能达到车站人脸识别的要求。但是，杨柳等人发现，即使是条件比较好的北京各大车站，也只有北京南站少数几个摄像头录制的视频能够达到A类视频标准。

“即使是在A类视频和1万重点人员库的测试情况下，也有漏报产生。”杨柳说，而且在B类以上级别时，漏报率和误报率都相当高，从采集图像的角度分析，人员驻留时间短，不足以将清晰的图像采集下来，脸部角度大，与库中的图片不匹配，严重受限于现场的安装条件。

“服务器性能的高度对测试结果的影响非常大。”杨柳强调，目前铁路系统人脸识别配备的硬件条件比较差，特别是旅客较多时，需要将每一个人员的脸部图像采集下来与后台数据进行逐一比对，但是服务器处理能力差，就会造成采集图像丢失，直接影响识别率。

与铁路视频动态识别面临同样困境的还有公安部门的视频“落地”问题。

公安部第三研究院所副研究员尚岩峰多年从事图像处理研究，参与过多个图像识别公安应用项目。他指出了人脸识别总体上不成熟的三大应用：第一，在高可靠人脸验证系统上，如支付、社保和门禁，视频或3D模型存在欺骗问题，错误拒绝率（FAR）在小于0.01%的条件下，拒识率可能高达30%以上；第二，安防用“认证一致性”的验证系统在FAR小于0.01%时，拒识率可能高达40%以上，身份证卡内人脸图像质量差，常小于1KB，现场用户配合程度不高，且环境也呈现不可控因素；第三，安防用黑名单监控类应用远未解决，在虚警率为0.01%时，识别率可能低于10%，视频质量差，表现出低分辨率、大角度拍摄、光照差的特点，而最大的障碍在于缺少可用的训练和测试数据。

研发了我国第一款带有生物特征的法定电子证件的公安部第一研究所副研究员宛根训则总结，视频动态人脸识别要在这些基础之上才能收到良好的效果：“采集设备为高清视频摄像机，光线和现场环境相对可控，通道人流方向相对单一，图像质量有较大改善。”

海量数据下如何更快

人脸识别所用到的深度学习算法是一套模拟人脑的神经网络算法，通过收集的海量人脸照片，新型的神经网络算法可以通过大数据训练将图片信息变成能够被机器理解分析的结构化数据。

苏光大指出：“基于深度学习的人脸识别难度在于训练的计算复杂度高，计算机不擅长二维计算，大量耗时在深度学习上，这是要解决的问题。”

那么，在算法、硬件和环境都达到条件的情况下，如何才能实现海量数据下人脸识别的快速查询？

在所有条件都具备时，数据量小的人脸特征随着人员数量增长也会变成大数据。在达到接近甚至超过人脸识别准确率的前提下，每一张人脸可小于1KB。但是，北京博思廷科技有限公司总经理王巍对不同规模的人脸数据库做了计算：1000万人脸的数据量可达到10GB，3亿人脸的数据量就是300GB。

“这样一来，人脸识别的对比速度马上就会降下来。”王巍说。

而速度的下降意味着不能实时识别，这对人脸识别速度要求十分高的反恐、防暴等公安安全监测而言，不是一个好消息。

例如，公安机关发现一个可能为逃犯的嫌疑对象，需要查询某身份未知人员的确切身份时，对比几百万人的在逃人员身份信息库，就会面临很大压力。如果要查询的是一个无家可归人员的信息，则要对比户籍人脸数据库，而一个省份的户籍人脸可达到数千万人。

如果要查询某可疑人员此前在何处出现，比如地铁，每日客流量可达到1000万人/天，3亿人/月，而且每个人可能在多个位置被抓拍多次。这样下来，人脸识别的数据量简直不可想象。

王巍指出，针对一个大小为1000万的人脸库的查重，若采用暴力对比法查，需要对比50万亿次。“制约人脸识别查询速度的因素有两个，一是基于数学模型的对比方法，最简单直接的就是暴力对比，效率低、速度慢；二是受限于设备的处理速度。”王巍说。

他建议，使用两种方法提升对比效率，一是改变对比方法，尽量避免暴力查询，如根据人脸图像属性切割、归属成不同类别，采用二分法可以缩减查询范围；二是增加设备或者服务器，提高运算能力，或是采用分布式系统架构，并行查询提升效率。

《中国科学报》 (2015-08-18 第5版技术经济周刊)

以下评论只代表网友个人观点，不代表科学网观点。

�� SSI �ļ�ʱ��

编辑部推荐博文
基金申请季，这里有2份攻略请查收！科学网2026年1月十佳博文榜单公布！ 2025年高引用的10篇中国作者《自然》论文智能火焰检测及传感器内运动感知铁电光电传感器光谱擒“劣”：一道彩光让百年前“地沟油”现形用于人机交互系统中运动检测的新型肌电图传感器更多>>