10月23日,在2024年世界科技与发展论坛主题会议“人工智能治理创新为培育科技治理生态构建国际信任基础”在京举行。会上,世界机器人合作组织理事长、中国科学院院士乔红发布了人工智能十大前沿技术趋势展望。
在AI共性技术方面,包括小数据和优质数据、人机对齐、AI使用边界和伦理监督模型、可解释性模型;大规模预训练模型方面,包括规模定律、全模态大模型、人工智能驱动的科学研究;具身智能方面,包括具身小脑模型、实体人工智能系统;生成式人工智能方面包括世界模拟器。
“从智能制造到智慧城市,从医疗健康到金融服务,人工智能的应用无处不在。然而,如何把握人工智能的发展方向,如何推动技术创新与产业升级,如何确保人工智能技术的可持续发展,这些问题都需要我们深入思考和探讨。无论是AI共性技术、大规模预训练模型、具身智能还是生成式人工智能等前沿领域,都充满了无限的可能和潜力。这些技术的发展不仅将为我们带来更加便捷、高效的生活方式,还将推动各行各业的创新和发展。”乔红说。
AI共性技术更加透明可信
随着AI发展,大数据的重要性已经不言而喻,然而大量无效数据的存在,不仅消耗了大量计算资源,也对模型可靠训练带来极大的挑战,小数据和优质数据的价值越来越重要。
乔红表示,小数据更注重数据的精度和相关性,优质数据通过严格的筛选、清洗和标注工具剔除了噪声和不相关信息,从本质上减少人工智能算法对数据的依赖和不确定性,增强网络可靠性。建设多样性的数据集不仅能够从理论基础上支撑不同技术路线的AI发展,还为解决通用人工智能的瓶颈问题提供新的可能。
除了输入的训练数据集质量,AI系统的可靠性还体现在输出结果的可执行性上。仅依靠数据和算法并不足以实现“人机对齐”,需要将人类的价值观和伦理道德转化为强化学习奖励函数。
“这意味着在设计奖励机制时,不仅要考虑任务的效率、效益和效果,还需要考虑行为是否符合人类的伦理标准。”乔红解释道,例如,在设计一个自动驾驶系统的奖励函数时,除了行驶速度和安全性,还应加入对交通规则的遵守、对行人和其他车辆的礼让等伦理因素的权重,从而引导模型学习到更加符合人类期望的行为。
当前AI系统的合规性、安全性和伦理问题愈发突出,乔红也提到要通过制定明确的标准和规范,确保所有AI系统在开发和使用过程中遵循既定的原则,减少AI在制度没有确定的情况下被过度使用所带来的风险。
促进AI在关键领域的应用,透明可信十分重要。乔红提到,在保障有效性的前提下,提高可解释性,有助于减少对公共资源的消耗,增强用户对AI系统的信任度,并促进其在关键领域的应用。例如在医疗健康领域,一个具有高可解释性的AI诊断系统能够让医生更容易理解判断依据,减少不必要的检查和治疗程序;在金融服务领域,可解释的AI模型可以更清晰地给出其风险评估和投资策略,降低风险。增强AI系统的可解释性还有助于在出现问题时进行调试和修正,确保系统的持续改进和优化。
驱动大规模训练模型不断革新
近年,大模型热度增高,正迅速改变产业布局,并开始塑造一种全新的用户互动模式。
乔红提到,基于海量参数和训练数据的大规模预训练模型能够有效提高人机交互和推理能力,增强可完成任务的多样性和丰富性。
“目前规模定律(Scaling Law)依然有效,这种规模效应不仅体现在语言模型上,也在图像处理、语音识别等多个领域中得到了验证。一方面参数量与数据量增长为模型提供了更为丰富的训练素材,另一方面算法创新也将开创新的规模范式。”乔红说。
这次发布的全模态大模型趋势,将打破数据壁垒,通过跨模态转换实现不同类型数据之间的理解和互动。例如引入通常用于捕捉三维空间信息的3D点云数据模态,对于机器人的导航和避障尤其重要。
在科学研究方面,乔红提到,科学家使用大模型、生成式技术等来增强和加速科学研究中的提出假说、试验设计、数据分析等阶段的效率,提高研究效率和准确性。
“科学家们可以利用AI技术进行实时的试验监测和调整,快速反馈试验结果,动态优化试验设计和假设。人工智能驱动的科学研究推动了科学进步和研究范式升级,牵引传统的线性研究范式向更加快速迭代和自适应的方向发展。这种灵活且高效的研究方式,大大提升了发现新科学规律的可能性,从而加速科学研究的进程。”乔红说。
创造无限可能的数字世界
目前,传统大模型可以协助机器人处理决策、任务拆解和常识理解等“慢通道”反应任务,但不适合做强实时性和高稳定性的机器人规划与控制快通道反应任务。
此次发布的具身智能小脑模型作为机器人运动的重要调节中枢,可以增强机器人应对不确定性和突发状况的能力,使智能机器人系统更加满足现实世界的精细操作与实时控制需求。
实体人工智能系统是将具身智能赋能于物理世界中的实体对象,“例如智能家居中的扫地机器人,不仅能够通过识别房间的布局和家具的位置实现动态规划清扫路径,还可以记住敏感物品的存放位置和主人的作息习惯,从而使传统设备能够突破其原有的功能限制,实现更高水平的智能化操作。”乔红说。
乔红提到,人形机器人是实体人工智能系统的终极表现形态,它不仅具备多模态感知和理解能力,能够与人类自然互动,还可以在复杂环境中自主决策和行动,并有望在未来应用到更多复杂的工作场景中。
2024年,随着OpenAI推出了在视频长度和稳定性上都形成突破的Sora,生成式大模型的讨论被推进到了“世界模拟器”的层面。
乔红也提到,通过综合考虑数据质量、多样性、模型训练策略和正则化技巧,生成模型在未见数据上的泛化能力得以不断提高,结合数字交互引擎提供沉浸式的高仿真体验,为使用者带来更加丰富和多样化的游戏世界,应用于教育、娱乐等领域,还可创造更多超级数字场景。
“例如通过生成模型创建虚拟实验室,学生可以在无风险的环境下进行科学实验,还能根据用户的喜好和行为习惯,自动生成个性化的游戏内容,从而提供更加个性化和互动性强的体验。在机器人领域,这种技术还可用于构建大规模、标准化的多模态机器人行为数据集,提高机器人本体设计、仿真训练和算法迁移的能力。”乔红说。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。