|
|
FCS | 文章精要:南京大学俞扬等——基于异质训练与通讯的开放真实世界人智协同 |
|
论文标题:Open and real-world human-AI coordination by heterogeneous training with communication
期刊:Frontiers of Computer Science
作者:Cong GUAN, Ke XUE, Chunpeng FAN , Feng CHEN, Lichao ZHANG, Lei YUAN, Chao QIAN, Yang YU
发表时间: 15 Apr 2025
DOI: 10.1007/s11704-024-3797-6
微信链接:点击此处阅读微信文章
引用格式:
Cong GUAN, Ke XUE, Chunpeng FAN, Feng CHEN, Lichao ZHANG, Lei YUAN, Chao QIAN, Yang YU. Open and real-world human-AI coordination by heterogeneous training with communication. Front. Comput. Sci., 2025, 19(4): 194314
阅读原文:
问题概述
人智协同旨在训练和部署能够与人类队友有效协同的AI智能体。最近的研究表明,通过与未见的人类队友进行训练,能在开放世界环境下进行良好的人智协同。然而,这些方法通常假设一个过于理想的场景,即认为智能体和人类队友之间的是同质的,这与真实世界的场景不符。为了促进在开放和真实世界中人智协同的实际部署和应用,本文发表了最新研究成果。
技术步骤
该团队为开放和真实世界中人智协同(ORC)提出了第一个基准。该基准被称为 ORCBench,包含了近期工作中常用的流行环境。它不仅考虑了开放世界的挑战,即具有不同未知水平的不同未知人类队友,还考虑了真实世界挑战,即智能体和人类队友从观察到能力都是异质的。此外,他们还为 ORC 引入了一个名为带通信的异质训练框架HeteC。HeteC 以异质训练框架为基础,通过使用混合队友训练和冻结历史队友来增强队友群体的多样性。此外,HeteC 还集成了一个通信模块,使人类队友能够与人工智能代理进行通信,从而减轻部分可观测环境的不利影响。作者提出了一个基准ORCBench,其中包括广泛使用的人智协同的环境和算法。此外,针对 ORC问题,作者提出了一个带有通信的异质训练框架HeteC,该框架建立在异质训练框架之上,并包含一个通信模块,使人类队友能够与智能体进行通信,从而减轻部分可观察环境的不利影响。
实验结果
为了验证 HeteC 的有效性,他们在 ORCBench 上进行了实验,并将其与现有方法进行了比较。首先,他们证明了 ORC 环境对最先进的 HAC 方法提出了挑战。接下来,他们评估了所提方法在不同布局和各种遮罩(即不同的智能体观察空间限制)下的有效性,包括与真人参与者进行的实验。他们的贡献为解决 ORC 面临的挑战迈出了重要的一步。
期刊简介
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办,南京大学支持,SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐B类期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;两次入选“中国科技期刊卓越行动计划”(一期梯队、二期领军)。
中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。