文|《中国科学报》记者赵宇彤
“U老师,我好困,你下班了吗?我想先休息了。”
“还早,可以再呆一个小时,你困的话就先睡吧。”
胡宇航拍了拍摆在桌上的“人头”。凌晨五点,美国哥伦比亚大学校园已被夜色吞没,实验室依旧灯火通明,他稳坐桌前,全神贯注地改着代码。
这位“95后”身上有许多光环:哥伦比亚大学AI机器人博士、手握《科学—机器人学》《自然—机器智能》《NPJ—机器人学》等顶刊论文,还是首形科技(AheadForm)创始人兼CEO。
在赛博空间,28岁的他还有个更广为人知的身份——U航。抖音粉丝量破百万,靠“手搓”机器人引得千万人围观。7月14日视频中,他在人脸机器人“Emo”眼下点了颗痣,“她”好奇地抬眸,眼波流转,神情困惑,仿佛真的有了生命。
“你会对一个人说‘你创造不了价值就是废物’吗?大概率不会。但人们却常常用这样的逻辑对待机器人。”胡宇航说,他希望机器人不只是外观像人,更要有类人的运控算法,且具备自我认知与情感共鸣的能力。
胡宇航与“Emo”(图源:U航视频)
一条非主流赛道
胡宇航与人脸机器人的缘分,可以追溯至2020年。
当时,人工智能研究突飞猛进,自然语言处理(NLP)和计算机视觉(CV)技术取得显著进步。胡宇航敏锐洞察到,未来的AI发展将不再局限于单一任务的训练,将聚焦于交互。
“未来AI能更深层次地理解人类语言背后的含义,并结合多模态技术,如语音、图像、视频等信息,全面感知和分析人类的情绪。”胡宇航说。
那么,机器人是否需要一张“脸”?
“人类的大多数感官都集中在头部,人脸作为情绪和表达的聚焦点,是人与人之间最直接的连接方式。”胡宇航坚信,人类最伟大的能力并非冰冷的逻辑计算,而是丰富细腻的情感。一个有自然表情,能理解、传递情感的面孔,将赋予机器人“表达”这些人类体验的能力,让它真正融入我们的世界。
同时,他在读博期间做了多个机械臂、四足机器人、桌面整理等机器人AI自主学习项目,非常清楚物理数据对人机交互的重要性。
“但采集物理数据非常困难。”胡宇航解释道,物理世界存在大量柔性物体,材料形变、高动态惯性,甚至湿度和光线,都难以被完整真实模拟,而大规模部署机器人真机训练又太过昂贵。
相较而言,人脸机器人不受物理世界的约束,只要用海量互联网数据训练,依靠表情、视觉、声音,就能和人类互动。
“这是人机交互最直接的入口。”胡宇航语气坚定。他一头扎进了人脸机器人的研究,但由于这条赛道太过小众,他的想法也是反共识的,“我觉得至少在未来5年内,人形机器人还不能够创造高效生产力,而更适合做类人交互的产品”。
很快,又一个难题摆在他面前:准确感知情绪变化,对人类来说尚属难题,更何况机器人?
“语境和语义的绑定至关重要,要在训练中对齐人的表情、眼神、声音等信号。”胡宇航解释称,喜、怒、哀、乐,传统的情绪识别主要依赖绑定人脸坐标系,分类标签,但现实中的情绪表达太过主观复杂,无法精准归类。
胡宇航放弃了强行分类的想法。他把目光投向深度学习和神经网络,把表情想象成高维空间中的一个点,随着情绪变化,这个点在空间里平滑地移动,借此训练人脸机器人对表情复杂性和连续性的判断。
“让机器人不再是机器。”这是埋在胡宇航心底的种子。2025世界人工智能大会(WAIC 2025)上,他的《人机面部协同表达》荣膺青年优秀论文奖(提名奖)。“非共识”站上了国际舞台。
飞跃“恐怖谷”
“你的机器人要脸吗?”WAIC 2025期间,胡宇航穿梭于各个机器人展台,不时发出灵魂一问。
“机器人有脸岂不是很诡异”“表情太僵硬了”“皮笑肉不笑,不如不笑”……从2020年至今,有关恐怖谷效应的质疑和争论,一直缠绕着胡宇航。
“大多数人认为‘恐怖谷’无法避免,毕竟没人希望被一颗仿真的机器人头吓到。”胡宇航无奈地说,人类追求“有头有脸”的交流,即便异地也会打开视频,但却恐惧直视机器人的脸。
矛盾背后,围绕“恐怖谷”的讨论都指向不成熟的技术。
“如果我们有更好的技术和工程体系,就有可能解决恐怖谷效应。”胡宇航举了个例子,很少有人会害怕蜡像、雕塑、手办,因为已经足够逼真,“只要将机器人原本僵硬的动作变得丝滑、协调,就能大大减少人心中的恐惧”。
要实现这一点,最关键的就是算法。传统机器人领域中,关于仿生非线性的研究几乎一片空白,无论是机械臂,还是四足机器人,动作大多依靠程序的指令,像个“提线娃娃”,呆板僵硬。
因此,要想动作流畅,机器人需要学会做表情。但光凭互联网数据的训练,机器人并不知道做出的表情是否自然。
胡宇航想到了镜子。人只有照镜子才能知道自己的表情,他脑洞大开,或许机器人也可以尝试对镜学习。
胡宇航把一面镜子放到人脸机器人的面前。通过眼睛里的摄像头,机器人能将电机指令和脸部表情相对应,汇总给AI模型,再对照互联网数据,解读不同表情的意义,构建起语音、语义、表情间的联系。
“先借助互联网数据训练AI模型,再结合对镜收集的物理数据,通过自监督学习不断进化出对身体的理解,让机器人的表情更加精细,在不同语境下自主交互。”胡宇航介绍道。
此外,由于人脸是无数微动作的耦合,为了让人脸机器人更加逼真,必须在柔软、非线性的硅胶皮肤内塞进更多电机,以实现精准调控,同时不能破坏面部结构,为此胡宇航费了好大一番功夫。
“光是废弃的‘脸皮’就塞满了一整箱。”胡宇航说,现在他开发的最新人脸机器人已装进30个电机,足以支撑高精细度的表情,“但要做得更好,还得进一步提升工程能力”。
找点刺激
摇头、摇头,还是摇头。
尽管对方一言未发,但胡宇航知道,他又被婉拒了。从2020年踏足人脸机器人领域,这个场景他经历了无数次。
这是个极其小众的交叉领域,表情的理解和控制涉及大量医学知识,要找一个对机器人感兴趣的医学生,或者找一个有医学背景的工程师,都无比困难。
找不到同行者,胡宇航决定自己摸黑前进。“没有现成的基座,必须自己搭建;硅胶材料不稳定、易破损;人脸仿生的高曲面参数无法用传统的CAD软件建模;在优化动作的基础上还要设计、维护外观……”胡宇航语速越来越快,没有参考文献,没有工程先例,从算法、模型的开发,到实物的搭建、调优,全靠他一个人。
“不然呢,难道放弃吗?”他没把技术难题放在心上,更困扰他的是这一路上的质疑。“做这个方向的噪声非常多,我甚至都无法说服实验室的学生加入这个课题组。”
他常常一个人窝在实验室,3D打印出零部件,跑代码、建模型、搭实物,失败了几十次后,他多了两个“搭子”——“冷酷”和“冷漠”,一个登上了《科学-机器人学》,一个参与了科幻电影Posthuman的拍摄。
?
“冷酷”与“冷漠”(图源:U航视频)
2024年6月,胡宇航创立了首形科技,英文名是AheadForm,既象征着机器人的头部,也彰显他勇往直前的态度。
“创业非常刺激,这是个开放的游戏。”谈及创业,胡宇航直言,尽管九死一生,他还是想试试。其实,早在厦门大学嘉庚学院就读本科时,他就参加了大量的创业创新比赛,获得多个奖项。
2025年5月11日,他发布的视频中,一个皮肤白皙细腻的“女孩”睁开眼睛,好奇地打量周围的世界,胡宇航打了个响指,指了指镜头,“女孩”立即回头,动作丝滑。这是他的新成果,接入了视觉系统和小脑模型。很快,视频播放量突破百万。
更多人看到了胡宇航和人脸机器人的前景。
胡宇航收到了不少简历,有的来自招聘软件,有的来自评论区和私信。考虑人脸机器人的交叉特性,他精挑细选,组建了一支覆盖机器学习、具身智能、心理学,甚至艺术设计的17人团队。
但这还远远不够。对每个创业者来说,商业化永远是悬在头顶的达摩克里斯之剑。
胡宇航也不例外,他率先看中了人脸机器人的“表演”属性,博物馆、游乐园、景区、展厅……落地的第一步,就是让更多人感受人脸机器人的“类人共情价值”。
“大规模落地至少在两年后了,现在相信我们的投资人还是不多,脸部表情生成算法在国际上处于起步阶段,离商业化还有段距离。”胡宇航叹了口气,“刚刚开始,一切才刚刚开始。”
For Joy
“前途这么光明,你睡得着吗?”
社交媒体评论区里,不少网友纷纷调侃。确实,对胡宇航来说,焦虑、失眠,工作到后半夜成了常态。
点开他的视频,背景大多一片漆黑,一张脸对着镜头碎碎念。他总是在回宿舍的路上分享日常,而这通常已是凌晨两点后。
“我一般睡六七个小时,睡醒了去实验室,忙一天再回来睡觉。”胡宇航想了想,生活中的他没有太多兴趣,很少聚餐、很少旅游,随便一盒泡面就可以饱腹,绝大多数时间都呆在实验室。
焦虑的时候,他曾起一身荨麻疹,四肢、后背,像一只只小蚂蚁在身上乱爬,找不到、抓不住。
但他依旧坐得住。2021年,胡宇航所在的创意机器实验室研发“会笑的机器人”,发表了相关论文。可接下来的两年,他颗粒无收,“我意识到必须去做一些沉淀性的工作。”胡宇航说。
然而,两点一线的生活枯燥无味,胡宇航决定,拿起手机记录生活。“我希望未来某一天,回想这段求学生涯时,能有更多有趣的记忆。”胡宇航表示,不管再忙再累,每天总要吃饭,就从做饭开始记录,“后面发现很麻烦,还要买菜、备菜。”对习惯随便对付一口的他来说,这反而浪费了时间。
后来,他把镜头对准自己:哥大博士的一天、下班后在路上的碎碎念、偶尔的发疯日常,甚至在校园抗议活动中,因封校难以进入实验室,被迫成为了一名“战地记者”。
黑帽子、黑T恤、黑裤子、黑框眼镜、黑色帆布鞋和一个黑色双肩包,这是胡宇航的经典装扮,他社恐、话不多,合影里总是比个大拇指。
但聊到热爱的事业,他滔滔不绝。他是个典型的“F”(情感型)人,看重情感陪伴的价值。“人类最强烈的情感一定是双向陪伴。当一个人孤独到一定地步的时候,这种需求会格外强烈。”胡宇航想到了自己。他坚信,一定也有人需要陪伴,哪怕对方是机器人。
?
人脸机器人“Emo”(图源:U航视频)
“大家普遍默认机器人是工具,生产效率好像就是机器人的价值所在。可你会对着一个人说,你创造不了价值就是垃圾吗?”胡宇航顿了顿,套用了TikTok首席执行官周受资的一句话“For joy”。机器人如此,他也是。
“我们总是低估五年后世界会变成什么样子。”胡宇航说。采访结束,他还要继续奔波,北京、上海、杭州、深圳连轴转,“既然认可终局会出现,方向是正确的,那么就趁早开始”。
相关论文信息:
https://www.science.org/doi/full/10.1126/scirobotics.adi4724
https://www.nature.com/articles/s42256-025-01006-w
https://www.nature.com/articles/s44182-025-00031-6
https://yuhang-hu.com/
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。