作者:赵广立 来源: 中国科学报 发布时间:2022-7-7
选择字号:
陈涵晟:一篇Paper天下闻

 

陈涵晟    阿里达摩院供图

■本报记者 赵广立

一名汽车学院的研二学生,凭借自己的数学功底和数学方法,以新视角解决了一项3D视觉领域的经典问题,然后以第一作者身份,获得了一项计算机视觉(CV)领域顶会的最佳学生论文奖。

这个颇有些传奇色彩的故事,近日在CVPR会议(国际计算机视觉与模式识别会议,IEEE主办)上上演。这个故事的主角,就是同济大学2020级硕士研究生、阿里达摩院研究型实习生陈涵晟。

如今,性格有些内向的他“一篇Paper天下闻”。和他在阿里达摩院同组的阿里高级算法工程师罗浩说,获奖之后组里收到了非常多的邀请,“从来没有过这种感觉”。

“说实话身边的人应该不会太意外——只要你接触过他,知道他的天赋,并了解他的付出。”对于陈涵晟的获奖,同学、好友这样评价。

巧!

一拍即合进入阿里达摩院

《中国科学报》了解到,这篇最佳学生论文,是陈涵晟2021年在阿里达摩院以研究型实习生身份完成的。这也解释了为何论文6位作者中有3位是阿里达摩院的算法专家。

每年招研究型实习生时,阿里达摩院算法专家王丕超都会优先考虑招聘博士生。“他们发表过一些论文,从中能够看出大概的水平。所以我一般不招硕士。”

陈涵晟是个例外。

王丕超先是看到了陈涵晟研一期间在CVPR发表的成果。那时,陈涵晟进军自动驾驶领域刚一年多,就发表了一篇他口中“只是一个根据经验设计的东西”。

但王丕超还是敏锐地嗅到了他的科研潜力。“看到他发的那篇文章,我感觉他做得还不错。”于是,王丕超主动联系了陈涵晟。

接到邀约,陈涵晟欣然参加了面试。

“面试过程非常开放,更像是讨论学术问题,我感觉到阿里达摩院确实是一个非常注重基础研究的机构。”陈涵晟告诉记者。让他下决心去阿里达摩院实习的另一个原因,是“他们计算资源确实很大”。

这在后来成为论文得以顺利完成的关键要素之一。在CV领域,一些数据集非常大,对计算有很高的要求。而他们的研究,恰恰需要非常高的GPU(图形处理单元)算力。

面试过后,陈涵晟和王丕超一拍即合,后者成为陈涵晟在达摩院的Mentor(导师)。尽管王丕超远在美国西雅图,但他们的学术交流仍以每周1~2次的频率开展。

强!

进入CV领域第二年即出获奖成果

正如文章开头描述的那样,陈涵晟很早就集齐了“跨界拿奖”所必需的元素。

陈涵晟已经记不清自己是从什么时候开始喜欢赛车的了,“初中?小学?很早就喜欢”;但他同时也喜欢数学和计算机,“从小就在电脑上画图”。

他对赛车和计算机的兴趣,一直没有消减。高考那年,陈涵晟同时瞄准了同济大学的汽车专业和南京大学的计算机专业。最终,他被同济大学汽车学院录取。

入学后,他加入了同济大学“翼驰车队”——这是一个由上百人组成的半商业化的赛车设计、制造组织,并定期参加大学生方程式赛车赛事(FSAE)。

“那时我专注于做空气动力学方面的工作,它涉及一些仿真计算,这个东西我以前非常感兴趣。”陈涵晟告诉记者。

当时的车队队长宁同学告诉《中国科学报》,有些想法其他人可能只是在嘴上说说,但陈涵晟真的会去尝试,实践能力很强,常常动手证实自己的结论,或实验或仿真,努力为之。

“在他一人‘操办’之下,车队的空气动力学设计实现了质的飞跃——使用测压孔测量尾翼和扩散器的下压力;采用独特的三段式尾翼布局形式,并在仿真上对弯道工况的气动稳定性做了大量研究;绘制气动图谱……众多创新点,不一而足。”

结果,这辆赛车的设计在2019年日本FSAE赛上拿到了“最佳空气动力设计奖”。“中国车队的空气动力学设计在国外赛事拿奖,这也是史无前例的事。”宁同学回忆说。

经此一役,宁同学提议让陈涵晟做车队设计部门的部长,但后者断然拒绝了。理由很简单——从大五(同济大学汽车专业为5年制)这年,陈涵晟开始对自动驾驶和CV产生了浓厚兴趣。

“我在大五的时候加入熊璐老师课题组,开始学一些相关知识,包括完成毕业论文设计。确切地说,我在做本科毕设时,才开始接触CV方面的内容。”陈涵晟对记者说,他既喜欢汽车又喜欢计算机,正好学院当时新成立了智能汽车研究所,他想借此机会,转型做自动驾驶的感知计算。

许多人可能觉得这个转型不容易,但陈涵晟却直言“那一年是这些年来最轻松舒服的一年”。原因在于,当时没有课业和科研压力,是“纯粹学习新知识,有很强的收获感”。

保研本校后,陈涵晟在研一期间的研究成果就投中了CVPR。这个成果,正是王丕超最初看到的那篇文章。

换句话说,陈涵晟在转向CV的第二年,就做出了破纪录的成果。

意外!论文偏冷门,没想到能获奖

对于论文能摘得最佳学生论文奖,团队上下多多少少还是出乎意料。

“我原来以为这篇论文可能比较冷门,因为太偏数学了。”陈涵晟说。

如何用普通的相机(二维图片)准确定位三维场景中的障碍物,是陈涵晟这篇文章阐述的重点。换言之,他要解决的问题,就是用一张2D图片定位3D物体的位姿。

“我对3D物体位姿问题比较感兴趣,在学校副导师田炜老师的指导下,研一发了一篇CVPR论文,就是在PnP(求解3D到2D点对应运动的方法)中加入了不确定性。去年到阿里达摩院实习后有些新思路,想搞清楚这个领域里的各种方法在理论上到底有什么联系。”陈涵晟告诉《中国科学报》,“我想找一个理论的框架,把所有的方法统一到一起,这就是我今年这篇论文的内容。”

“论文一开始只有数学。”陈涵晟介绍,最开始,他自己也不清楚这些数学公式会发挥什么作用。

“一开始我并没有抱太大期望,只是个人兴趣。不知道这套理论的东西是否真正有用,也许只是新的花样而已。后来我把算法完善之后,真的把实验做出来,才知道它有这么好的效果。”陈涵晟说,“现在看来,它确实和其他论文不太一样,算是一个小突破。”

王丕超虽然多次说过这项工作很不错,但他也没预料到成果能拿大奖。阿里达摩院算法专家唐家声说,由于获奖出乎预料,以至于没有一位作者到现场参会,只能远程领奖。

拿到这样一个重量级奖项,陈涵晟表示“有点压力”,但他本人“还是不想太‘卷’”。“只要有一个不错的环境做自己想做的研究,就非常好。”他说。

相关论文信息:

https://doi.org/10.48550/arXiv.2203.13254

《中国科学报》 (2022-07-07 第4版 人物)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
听导师的话,毕业论文答辩这样准备 大规模基因研究重绘开花植物的生命之树
彭慧胜院士团队把“充电宝”做成衣服 缓解肠易激综合征  饮食比服药更有效
>>更多
 
一周新闻排行
 
编辑部推荐博文