生命科学 医学科学 化学科学 工程材料 信息科学 地球科学 数理科学 管理综合
 
作者:郝俊 来源:科学时报 发布时间:2010-11-8 6:57:29
计算机夺权驾驶员 基础科研供马力
——智能车挑战重大科学问题

 
“中国智能车未来挑战赛”比赛现场。在“复杂环境综合测试”比赛中,中科院合肥物质科学研究院先进制造技术研究所的参赛车辆有着优异表现。测试刚刚完成,研究人员们便聚在一起讨论问题,交流经验。 郝俊/摄
 
□ 郝俊
 
没有风驰电掣的速度,也没有震耳欲聋的马达轰鸣,更没有惊险刺激的超车场面。这里是位于长安大学渭水校区的2010年广汽丰田杯“中国智能车未来挑战赛”比赛现场。
 
如此平静的汽车比赛,让多年从事竞速汽车运动报道的体育记者有些纳闷:“我们的观众如何能够看到兴奋点和技术呢?”
 
波澜不惊的表象下,实则暗藏着每一个参赛车队、裁判员和现场观众的忐忑与期待。每当看到车辆能够平稳行驶在车道上、安然通过路口、顺利转过弯道,跟随在比赛车辆身后的人群就会不时地鼓掌欢呼。
 
这些没有太高技术含量的基本行驶能力,之所以引得人们的赞叹,全在于每一辆车都是无人驾驶!
 
“这个赛事是一种智力比赛,人的智力通过汽车载体来表现出参赛队的水平高低。”
 
作为国家自然科学基金委员会“视听觉信息的认知计算”重大研究计划指导专家组组长,中国工程院院士、西安交通大学校长郑南宁解开了那位体育记者的疑问。
 
研制具有自然环境感知与智能行为决策能力的无人驾驶车辆验证平台,是“视听觉信息的认知计算”重大研究计划的总体目标之一。
 
用汽车做载体的图灵测试
 
近日,2010年广汽丰田杯“中国智能车未来挑战赛”在西安举办,旨在以比赛为载体,交流和验证我国“视听觉信息的认知计算”研究成果和进展。
 
所谓智能车,其核心在于车辆本身具备自主驾驶能力。参赛车辆安装了摄像头、激光雷达、超声雷达等传感设备,用以感知周围环境并识别道路和交通标识,进而通过信息处理让计算机像驾驶员一样对车辆实施准确、迅速的操控。
 
“比的不是汽车动力学性能,而是看计算机能不能达到一般驾驶员的水平,要比它具不具备驾驶员的图灵智能,甚至可以考它是几级驾驶员。”中国工程院院士李德毅更是一语道破智能车挑战赛的精髓,称之为“用汽车做载体的图灵测试”,而“图灵测试”已经成为测试机器是否具备人类智能的代名词。
 
无疑,驾驶员首先需要具备的就是视听觉的认知能力,而让机器来代替驾驶员思考并行动却非易事。
 
本次比赛的“复杂环境综合测试”环节,在3.6公里的路程中设置了“环岛行驶”、“禁行”、“交通信号灯”、“停车让行”等多种交通标志,还有“U形”转弯、变更车道等行驶任务,然而在全部9支参赛车队中,仅有2支在人工干预下于规定时间内跑完了全部路程,且没有一辆车成功完成全部测试任务。
 
值得一提的是,比赛组织者在赛场使用了GPS干扰器,其目的,在于让车辆真实展现其通过“视听觉信息的认知计算”而取得的自主驾驶能力,而非在导航辅助下的行驶。
 
李德毅介绍说,现在的GPS导航精度很高,定位到车道很容易,如果参赛车把GPS导航加载到车上,“不用视听觉也能开过去,这样就违背我们的初衷了。”
 
为了科学准确地考核无人驾驶车辆平台在智能环境感知和自主驾驶行为方面的阶段性成果,国家自然科学基金委员会专门设立了“智能测试标准与环境设计”重点支持项目,由中国科学院自动化研究所和北京理工大学两个项目组负责比赛的测试内容、评分标准和比赛规则等方案的制定。
 
本届比赛裁判组组长、中科院自动化研究所研究员王飞跃参与了比赛场地和比赛内容的设计,他向记者介绍说:“让计算机来开车是一件相当难的事情,因此场地设计不能太难,但也不能体现不出视听觉能力。”
 
参赛车队为了提升车辆的“视听觉感知能力”,使用了各种高端传感设备,比如一些造价不菲的激光雷达。
 
在李德毅看来,真正的比拼,并不在于车好、雷达好。他举了一个形象的例子:“你2.0视力的眼,不一定比1.2视力的开车技术好。”原因在于,“虚拟驾驶员的智力水平,不全在机器人的视力,而是对视听觉信号、信息的感知、处理和理解的认知能力!”
 
“认知”则是摆在当前信息科学面前的最大难题,也是一直以来的研究热点。
 
“人的视听觉能力是靠大脑,而大脑的机理是正在探讨中的未知。因此,研究一种能够代替人思维的计算模型,是带有很大挑战性的。”中国工程院院士、国家自然科学基金委员会信息学部主任柴天佑道出了比赛车队遭遇各种困难的根本原因。
 
科学任务带动科学问题的研究
 
2008年8月,历经8年多的近30次不同规模和范围的专家研讨和论证,国家自然科学基金委员会通过了重大研究计划“视听觉信息的认知计算”的立项。
 
致力于促进我国基础科学研究的国家自然科学基金委,面向国家未来的重大需求,在此重大研究计划中提出了若干个需要解决的基础科学问题,包括:构建新的计算模型与计算方法,提高计算机对非结构化视听觉感知信息的理解能力和海量异构信息的处理效率;感知特征提取、表达与整合;感知数据的机器学习与理解;多模态信息协同计算。
 
面对这些抽象的科学问题,国家自然科学基金委信息学部提出,将这些科学问题凝聚到一个载体上,用科学任务来带动科学问题的研究,并争取取得原创性的成果。
 
在本届比赛开幕式上,国家自然科学基金委员会副主任孙家广说:“无人驾驶车辆及其比赛向世人宣示,我们搞基础研究的,也要有实实在在的载体和平台,也要实实在在地为经济社会发展作贡献。”
 
在李德毅看来,该重大研究计划是要解决信息科学领域具有前瞻性、战略性和基础性的科学问题。而在研究中产生的技术革新,则可以“辐射”到汽车行业,比如提高汽车电子的国产化水平。
 
在比赛现场,人们能够直观感受到的都是看得见、摸得着的技术问题,不容易联想到基础研究的层面。
 
而郑南宁告诉记者:“解决工程技术问题的背后需要大量的基础研究。特别是信息科学与其他科学技术相结合的过程中,基础科学问题和工程技术问题不能截然分开。要让机器和计算机来实现视听觉认知,只有解决一个符合视听觉认知过程的计算模型,然后在该模型下解决可计算性和计算复杂度问题,才有可能最终实现。”
 
对科学与技术之间的关系,李德毅则有着更深的思考:“我们要理解信息科学和技术的特殊性。信息科学可以引导技术的发展,但更多的时候,是技术作为科学的先导。”
 
“工程技术问题是很复杂的,因此要善于把现实问题形式化,并与现实问题剥离,最终把它变成一个科学问题。”李德毅说。
 
“视听觉信息的认知计算”重大研究计划涉及计算机视觉、神经心理学、图像信息处理等众多基础学科,因此联合了国家自然科学基金委信息学部、生命学部和数理学部的众多专家。
 
柴天佑介绍说:“重大研究计划是希望把各领域科学家的研究集中起来,围绕着一个方向来努力。”这也恰好体现出用科学任务带动基础研究的好处,能够通过任务凝聚各方才智,凸显团队力量。
 
除此,“无人驾驶汽车这种科学任务,还能改变当前科学评估机制中过分强调论文数量、奖励等级的简单化倾向,提高同行评议的客观性”,李德毅相信,此种科学任务的形式亦有助于改变学术风气。
 
让比赛遗憾成为研究动力
 
各车队在经受“基本能力测试”和“复杂环境综合测试”的考验之后,为期3天的挑战赛落下帷幕。
 
尽管测试内容并不复杂,但很遗憾没有一个车队顺利完成所有测试。比赛期间,还有个别车队因技术和设备等原因中途退场。在郑南宁看来,挑战赛的结果和各队遇到的挫折,为今后的研究提供了可贵的经验和努力的方向。
 
挑战赛闭幕式上,郑南宁语重心长地说:“这次赛事最重要的收获,是让我们清醒地认识到,迈向重大研究计划的最终目标,我们还有相当长的路要走。让实验室的研究成果走向真实世界,是一个复杂的过程,我们还需要更加扎实、更加深入的研究。各个参赛队的不足和遗憾,恰恰是今后研究的动力和突破点。”
 
李德毅的研究团队没有参加这次比赛,而是在赛事期间开了一场“缩微智能车自主驾驶研讨会”,并在缩微道路环境上演示了缩微智能车自主驾驶的十个“折子戏”。
 
“路边的美女看不看?”李德毅用这个问题来说明智能车视觉认知的难点。在他看来,驾驶员的自然视觉有三种情况:视而不觉,先视后觉,边视边觉。
 
而目前参赛车队的机器视觉,都是先视后觉的。也就是用图像分割和模式识别的传统思路,来处理视觉信息的认知计算问题。“如何做到边视边觉,才应该是这个研究计划中基础科学的精华。”李德毅说。
 
针对“边视边觉”的提法,郑南宁认为,机器要完成与人相仿的智能化视觉信息处理,确实需要在计算模型和结构上有所创新,而在这些科学问题中,“中国学者或许是有机会做出一些原创性的成果的”。
 
值得注意的是,无人驾驶智能车在多方面涉及生命科学,然而本次比赛却几乎没有生命科学领域专家的身影。“生命科学领域的学者现在介入得不是很深,因为过去信息科学和生命科学的交流不太多。探讨新型传感器和新的计算模型将会促进双方的交流。”郑南宁解释。
 
据李德毅透露,2013年全球人工智能大会将在北京召开。他希望智能车研究这一科学任务,能够成为我国和全世界交流视听觉认识计算科学问题的切入点。
 
《科学时报》 (2010-11-08 A4 科学基金)
发E-mail给: 
    
| 打印 | 评论 | 论坛 | 博客 |

小字号

中字号

大字号