

图片来源:百度图片
■本报记者 韩天琪
最近一段时间,测“颜龄”游戏刷爆了微信朋友圈。这款神奇的App到底用了什么“招数”?且听中国科学院计算技术研究所助理研究员王树徽慢慢道来。
“测‘颜龄’用到的是计算机领域人脸识别的基础技术,”王树徽告诉《中国科学报》记者,“简单来说就是把很多人的面部特征数字化,建立数据库,然后把记录下来的数据和将要识别的人进行对比。”
据王树徽介绍,测“颜龄”的人脸识别技术首先要采集人脸图像,扫描图像中类似人脸的区域,定位人的五官,采集人脸的特征,包括人的皮肤、眼睛、口、鼻周围的纹理等信息,生成若干关键点,并将数据记录下来。然后设计好人工智能系统的算法,形成一个训练数据集。
“剩下的就是分类问题了,这样记录下来的数据集将是一个非常大的数据库,其中的数据都有关于年龄的标注,每个年龄的人都有自己的样貌特征。人们在测‘颜龄’的时候,就是在用自己的样貌与数据库中的数据进行匹配。”王树徽说。
但是这种特征数据和模型一样,都是有一定范围的,因此误差不可避免。这也是有的网友称拿土豆也测得出“颜龄”的原因。王树徽解释:“所有的统计都是不确定性的推理,也并不是百分之百准确的,这种拿着土豆居然也测出了‘颜龄’的例子可以放到误差的范围内。”
不过可以肯定的是只要数据量足够大,深度学习的效果一定会好,数据量越大,越能体现真实世界的情况。
王树徽坦言,其实测“颜龄”在人脸识别领域是最基础的技术,只是之前没人想到将它运用到社交媒体上。有越多人使用测“颜龄”App,就可以采集越多数据,如果模型容量已经包含那些“颜龄”与自己实际年龄不符的人,只要数据量大,还是可以做到精细判别的。
简而言之,数据库的数据量越大,测出的“颜龄”就越准。
“深度学习出现之后,我们已经知道怎样去无限地增加模型容量,现在的问题是怎么去找数据。”王树徽说,“之前找数据都是在实验室环境下采集的,容量不会太大,基本上是万量级的。后来人脸识别领域出现了叫作LFW的技术,即从互联网的社交媒体中收集作据并作标注,这就极大地扩展了数据来源。”
近日,中科院上海生科院计算生物学研究所所长韩敬东博士的研究团队正在研发一款“3D面部年龄预测仪”,原理与此大致相同。
据王树徽解释,“3D面部年龄预测仪”运用的是多目合成技术。“比如用3台摄像机放在人脸的不同位置拍照,之后就可以用3D技术合成人脸,摄像机越多,合成的越精准,在测‘颜龄’时,3D的肯定比平面的更准。”
不过3D人脸合成技术的输入会比较复杂、处理的数据量会大,也更困难一些。“无论是3D还是平面的‘颜龄’测试,海量数据都是保证其准确性的关键。”王树徽最后说。
《中国科学报》 (2015-05-29 第7版 科普)