作者:杜珊妮 来源:中国科学报 发布时间:2025/12/23 16:10:44
选择字号:
迈向“具身智能”:香山科学会议共议具身智能发展新路线

 

当机器人走进生产制造车间,无论是机器臂灵巧搬运零部件、感知周围环境并自主调整动作的场景,还是智能搬运车悄然穿梭、与工人协作完成复杂任务的画面,都生动展现了具身智能技术从实验室验证加速走向工业级应用的进程。工业制造领域,具身智能与机器人技术的深度融合,正成为智能化升级的核心驱动力。

近日,在香山科学会议第800次学术讨论会上,围绕“复杂多场景具身智能机器人技术突破与跨领域协同”主题,来自高校、科研院所和产业一线的数十名与会专家,展开了一场充满辩证思维的务实争鸣。

中关村大成智慧联盟(钱学森学派研究中心)理事长白雲帆在会上指出,“具身智能是推动全球机器人产业迈向‘通用智能’,解决复杂场景下的自主决策难题,提升多场景任务泛化能力的关键。我国应将突破具身智能关键技术作为追赶超越和培育新质生产力的战略抓手。”

以身体交互重塑智能范式

构建能够在工业制造、灾害救援、农业生产等多样化环境中自主感知、决策与执行的智能机器人体系,是发展复杂多场景具身智能系统的核心目标,也是本次会议研讨的焦点之一。要实现这一目标,首要任务是推动人工智能范式发生根本性转变。

白雲帆指出,具身智能的本质在于“身体—环境—认知”的深度融合,其理论基础需突破传统人工智能“离身计算”的局限,转向以真实物理交互为核心的“具身认知”路径。在这一框架下,感知与行动不再只是任务执行的末端环节,而是智能生成与持续演化的重要来源。然而,从现实进展来看,这一转变仍面临明显瓶颈。“多数系统仍处‘多模态算法叠加’的弱具身阶段。”白雲帆说。

围绕这一范式转变,清华大学计算机科学与技术系教授孙富春认为,具身智能机器人的发展核心在于构建以“环境交互与智能发育的正相关性”为科学依据的跨学科交叉理论体系。

他强调,这一体系“旨在阐明‘大脑-身体-环境’三位一体的智能涌现机制”,必须融合机器人学、神经科学与认知科学,阐明智能如何在与物理世界的持续“碰撞”中涌现,而非仅仅依赖预先编程的海量数据。这意味着机器人不仅依赖预设指令完成任务,更需通过触觉、力觉等感知实时捕捉环境变化,并自主调整策略。这种“手脑合一”的实时学习与适应能力,是应对复杂、多变任务的关键。

那么具身智能如何在工业实践场景中落地?西安交通大学机械工程学院教授梅雪松以其团队研发的移动操作机器人为例,揭示了将“身体”融入智能控制的关键挑战。他提出的加权阻抗控制律等技术方案,正试图赋予机器人“肢体”以仿生的柔顺性——让机器臂在保持作业精度的同时,能实时感知并顺应微小的接触力变化。

当复杂的软硬件系统推向多样化工业场景的同时,也引发了关于研发范式本身的深刻思考。中国兵器集团西安现代控制技术研究所研究员韩静提出,应推动研发从“基于文档的系统工程”向“基于模型的系统工程(MBSE)”转变,构建自主研发现代化构型管理框架。她认为,通过数字模型与数字孪生技术,实现设计、验证与优化过程的模块化和标准化,是降低创新风险、提升系统可靠性的基础条件。

与此同时,多位与会专家对通用具身智能的实现路径也保持审慎态度。清华大学电子工程系教授刘加表示,在机器人技术发展初期,应重视多样性与专业性。他指出,“机器人应像工匠一样,擅长某一项工作,做到极致”。对此,多位与会专家认为,真正的通用能力往往孕育于大量专用系统在复杂场景中的长期打磨之中。

迈向“通用”之路

在推动具身智能发展的同时,如何构建可广泛适用的通用机器人平台成为本次香山科学会议关注的焦点。

针对“通用性”这一目标本身,中国航天科技集团一院18所研究员黄玉平指出,具身智能机器人通用性研究主要集中于特定角色,导致大范围通用性不足。“如果通用范围越大,可通用的部分就越少”。他认为,为提高研发效率和避免重复开发,当前的具身智能机器人研究应该制定规范,进一步明确具体的研究范围,因为其通用性需求本身可能很难实现。

与之呼应的是,一种建设性思路则将“通用”理解为可组合的模块化能力。“通用性应被定义为支撑多任务的通用硬件(如灵巧手)或通用软件算法,而非大范围通用”。中国电力科学研究院研究员郑彬说。

围绕通用机器人平台的构建路径,与会专家还从智能架构与技术范式层面给出了不同视角的思考。

中国科学院自动化研究所研究员王飞跃指出,大模型技术——尤其是由VLA模型(视觉—语言—行为)为代表的具身智能与平行智能的ACP框架(人工系统、计算实验、平行执行)正融合驱动人工智能从单纯的“数字大脑”迈向与物理世界深度交互的“行动实体”。

前者赋予机器人感知和行动的统一能力,使其能够在多场景下灵活应对复杂任务;后者则为机器人提供“智慧大脑”,通过模拟和优化策略的平行实验,生成可在现实中执行的高效决策。他强调,这种融合正在推动能真正理解环境并自主行动的“超级智能体”向前发展。

随着智能体从独立作业走向群体协作,北京大学电子学院教授程翔创新性地提出“机器联觉”概念。他认为,要超越简单视距任务,实现复杂超视距协作,必须突破传统通信与多模态感知相互分立的局限,探索两者在AI原生层面的深度融合机理。

以刚需场景定义协同生态

当具身智能走出“能力演示”的实验室,其面临的终极考场是复杂的产业现实。当前,具身发展正进入场景驱动的“深水区”,技术的价值与突破方向正由核工业、高危巡检、现代农业等最具紧迫性与复杂性的“真实战场”所定义。

“在石油炼化、化工、井工煤矿等复杂多场景,巡检作为安全生产关键环节的重要性及机器上岗是刚性需求。”在棋赫科技集团研究员陈昊看来,类似的生产作业场景,不仅要求机器人具备自主感知与决策能力,更必须满足防爆认证等绝对刚性的安全法规。

另一方面,面向国计民生的农业场景同样为具身智能提供了规模化落地的现实土壤。中国农业大学教授陈建分享了其团队研发的智能农业机器人。他指出,面对传统农业中人力效率低、现有装备“检测受限、抖动、算力不足”等瓶颈,需从具身智能可交互感知的核心特点出发,构建感知决策控制一体化的农业机器人系统。“目前,我们的农业机器人系统已在多地示范应用,有效降低育种人力投入、提升粮食单产。”陈建说。

从极端高危场景到大规模农业生产的多样化需求,构建高效的跨领域协同创新生态同样关键。

北京科技大学教授班晓娟指出,具身智能作为一种通过物理载体与环境交互实现感知—认知闭环的新范式,其发展不能依赖单一学科或单一主体。“必须推动学科、产业、政府、机构和用户之间的协同,否则实验室成果难以真正进入产业系统。”班晓娟说。

她认为,当前跨领域协同仍面临学科语言不通、评价体系差异和任务接口不统一等现实障碍,需要在真实应用场景中,通过规模化需求逐步推动协同机制和标准体系的形成。

多位与会专家表示,具身智能的产业化路径尚不清晰,应以“需求牵引+技术攻关”为主线,指定基本规范和发展路线图。在高危作业、极端环境和农业等刚需领域率先跑通应用闭环,通过示范项目积累经验,逐步沉淀可复制的技术规范与协同机制。在这一过程中,政府引导与市场机制的协同作用,将为具身智能从实验室走向产业应用提供重要支撑。


 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
全球变暖可能引发下一次冰河时代 《自然》展望2026值得关注的科学大事
世界首条正穿冰川一级公路隧道取得进展 我国发现镍铋新矿物金秀矿
>>更多
 
一周新闻排行
 
编辑部推荐博文