科学网—小心，你的参赛对手是“数字人”

作者：温才妃来源：中国科学报发布时间：2023-3-21

选择字号：小中大

小心，你的参赛对手是“数字人”

数字人“灵”

■本报记者温才妃

“你们所需要的启动资金是多少？”

“我的启动资金是20万元，我希望以转让股权的方式吸引到一位投资人加入，以促进我们公司更好、更快发展。”流利给出答案的同时，“灵”的目光流转，很自然地做出了一个欢迎的手势。

这位名叫“灵”的“女孩”，扎着高马尾辫，穿着白衬衫、灰裙。不特别留意，你很难发现她的“小秘密”——就在3月19日结束的第十三届“挑战杯”中国大学生创业计划竞赛上，她作为001号参赛选手参与项目演示，一举拿下了“挑战杯”大赛金奖。

这位“挑战杯”办赛史上的第一位数字人—— “灵”是怎么诞生的？带着这份好奇，《中国科学报》记者来到了北京理工大学教授翁冬冬的实验室。

能换装、换发型的数字人

一间光线幽暗的实验室，一旁的摄像头星罗棋布包裹成一个“大球”，让人感觉来到了一个星际空间。这里就是数字人“灵”的诞生地。

“大球”里共有80个三角面、42个顶点和120条边，边的中点和顶点上安装光源，实际光源数量为156个。球形灯光舞台围绕其中心均匀排布36台佳能850D相机，用来采集各视角下的人脸图像、极限表情和人脸材质。

演员坐在球的正中央，在快门频繁开合、后台算法的运算下，最终制作出团队重建高精度人脸三维模型、高精度多通道人脸材质。在“大球”中，生成的数字人有数字明星李星澜、手语主持人千言等。

与以往数字人的诞生有所不同，此次北京理工大学团队开发的“灵”完全由数字生成，并没有真人原型。她由800多块骨骼协同控制其面部的表情，同时由82个材质参数的变化进行面部材质的动态调整，成为一个栩栩如生的数字人。

“作为‘挑战杯’数字化办赛的形象大使，‘灵’的登场将开启数字技术基础上的办赛、办会新模式。”受访时，北京理工大学团委书记刘渊说。

据介绍，“灵”是本届“挑战杯”数字化参赛的引导者。与“灵”搭档的还有一名数字人“境”，作为本届“挑战杯”元宇宙世界的引导者。“灵”与“境”共同组成“灵境”一词，是著名科学家钱学森对“Virtual Reality”（虚拟现实）的中译。

早期的数字人多基于二维体系构建而成，由于解耦程度比较低，换衣服、换发型、换光线等效果都难以实现。

如今，技术已发展到在三维体系中制作数字人。“二维与三维有点像电影与游戏的区别——电影拍完不能改，而游戏由玩家控制。三维数字人，其表情、服装、头发甚至动作都可以实时变换，二维体系下的数字人却很难做到。”翁冬冬说。

比如，“灵”可以换装，在刚出场时穿着生活装，到正式场合就换成了礼服；脸部的光线也会随着白天、黑夜有所变化，从而使表情更灵动、自然。此外，随着话语内容的不同，“灵”还可以做出丰富多样的播报动作。

“捏脸”的有意思之处

在元宇宙中，数字人是不可或缺的角色。

7年前，北京电影学院与北京理工大学等高校合作成立了北京市未来影像高精尖中心。当时，翁冬冬接到的任务是做“沉浸式叙事”。简单来说，就是在虚拟现实空间中把故事重新呈现出来。研究之初，他发现了一个重要问题——没有“演员”。为此，团队决定做高逼真数字人。

在做超写实数字人之前，有人曾问过翁冬冬，“95后”Z世代喜欢二次元，为什么不考虑做二次元？

事实上，二次元作为小众文化，远没有真人参演的影视剧数量多。那么，是真人就一定要“像一个人”。

把表情做得生动是第一步。“数字人的表情应该非常丰富，能根据控制需要，准确地做出喜、怒、哀、乐等各种表情。同时，数字人的表情还应该个性化，使得每个数字人看起来都与众不同。” 团队中负责表情驱动的北京理工大学博士生包仪华解释道。

第二步是精确采集人的表情。为此，系统需要非常灵敏，即使演员做出了一个非常微小的表情动作，系统也能立刻将其准确捕捉。“如今毫米级的采集已可以做到，但对人脸而言，仅仅精确还不够，要保证采集能在一个很快的速度下完成。”翁冬冬说。

做人脸之所以困难，是因为我们对人脸太熟悉，同时又存在太多不同的语言体系对其进行描述。包仪华表示，他“最害怕的是和艺术学老师在一起讨论数字人”，因为“他们常说数字人缺少神韵”。

“神韵是啥？能否说具体一点？”

“我已经说得很具体了，就是没神。”

之前，翁冬冬团队在做“数字梅兰芳”项目时，就经常出现这样的“尬聊”。“我们拿尺子去量，你看脸、鼻子的距离一样，但拼合在一起，艺术学老师就是觉得不一样，这就是人脸的有意思之处。”

数字人去打一场比赛

美国传播学家艾伯特·梅拉比安曾提出过一个公式——沟通时信息的全部表达=7%语调+38%声音+55%肢体语言。

看到这个比例，你也许会很吃惊，原来大部分信息是通过肢体语言和表情传达的。但语言、表情和动作等通道间的不协调，却会使数字人产生错误的表达。比如，一个人嘴上说“很有道理”，眼神却流露出轻蔑，你会相信这句话是真的吗？

翁冬冬告诉《中国科学报》，相比从前只有声音、没有形象的人工智能，有形象的智能数字人在是否“像人”方面，被寄予了更高的期望和要求。一个简单的“不当行为”就可能暴露出数字人的“虚假本质”。比如，银行入口站着一名“接待员”，当有顾客经过时，真人的目光会跟随，会跟顾客打招呼，而数字人却可能无动于衷。

翁冬冬一直在想“要不要给数字人赋予需求，因为有了需求的智能体才会像人一样主动探索世界”。比如让数字人会饿、有社交焦虑等。

他把这一想法放在“灵”身上实现，便是给予她参赛选手的身份，让她有“竞争”的需求。站在元宇宙的舞台中央，“灵”作为北理工“元宇宙时代下超逼真智能数字人行业引领者 ”团队的参赛选手，落落大方地为台下“观众”介绍这款专门对抗老年人智力流失的VR游戏。他们还引入由清华大学团队开发的、类似ChatGPT功能的聆心智能。

有意思的是，考虑再三，翁冬冬最终还是决定把“灵”的赛场形象做得“假一点”。“真是担心选手们把‘她’与真人混淆起来。”采访结束前，翁冬冬笑道。（本文图片由受访者提供）

《中国科学报》 (2023-03-21 第4版高教聚焦)

编辑部推荐博文
基金申请季，这里有2份攻略请查收！科学网2026年1月十佳博文榜单公布！ “双肩挑”教学副系主任的困境氧气促进生物复杂性进化的细节《自然》从六个期刊看人类活动对大气的影响马年说带马字的植物马蔺更多>>