作者:陈彬 来源: 中国科学报 发布时间:2025-10-29
选择字号:
人工智能也可以有“基因”?

 

■本报记者 陈彬

与人类相比,目前人工智能的知识学习效率是更高还是更低?

“这并不是一个很好回答的问题。”接受《中国科学报》采访时,东南大学教授耿新表示,如果只是学习某个单一知识点,人工智能可能在极短时间内就能掌握。但如果是一些相对复杂的知识,比如对一个从未见过狗的孩子来说,只需仔细观察几张狗的照片,就能很快识别出现实中的狗,甚至能区分不同品种的狗,而要想让人工智能明白狗是什么样子,往往需要提供几万个训练样本。

在耿新看来,人工智能在这方面的学习效率远不及人类的一个主要原因是前者缺乏一种与学习相关的“基因”。而他目前从事的研究就是让人工智能获得这种“基因”。近日,耿新团队在人工智能神经网络学习范式方面取得的最新研究进展在线发表于《人工智能》。

“随机初始化”和“基因初始化”

针对人工智能与学习相关的“基因”,耿新团队提出了一个原创性概念——学习基因。“学习基因可以被简单看作人工神经网络一种可‘遗传’的信息片段。我们希望它能像生物基因一样,将与特定任务无关的普适知识‘封装’起来,并传递给新模型,从而实现更高效、通用的知识迁移。”

这个概念并不容易理解,要想弄清其含义,可以回到本文开头提到的“认识狗”的例子。耿新解释说,对人工智能来说,理解什么是狗与学习其他复杂知识体系的底层逻辑是相似的,都需要依赖海量样本、通过多轮训练,才能建立起对于某个事物的基本概念。

每个人工智能模型在“认识狗”之前,都需要依赖海量的数据样本。然而,当新一代人工智能模型被研发出来,这样的流程又必须重新进行,因为目前的人工智能模型不管有多么先进和复杂,其诞生时都处于“随机初始化”的状态。

“所谓‘随机初始化’,就是在新的大模型框架构建出来后,研发人员为它设置一个初始参数,这个参数通常是随机生成的,且与此前的大模型没有任何关联。”耿新解释说。

如此一来,无论之前的人工智能模型学习到多少知识,其“经验”都无法遗传给新一代模型,这无形中耗费了巨大的计算资源。问题是,人类婴儿同样无法从父辈直接继承记忆与知识,为何仍能够快速学习,而不用“重来一遍”?

“这就是最奇妙的地方。”耿新说,人类的遗传机制虽不能传递父辈的具体记忆或知识,却遗传了一种更关键的能力——元学习能力。他表示,元学习是一种学习机制,不直接指向具体的知识或技能,而是关注学习过程本身的优化。因此,元学习能力可以理解为一种“如何学习的能力”。

“从某种意义上说,刚出生的婴儿也处于一种初始化状态,但这种初始化并非随机,而是一种‘基因初始化’。”耿新指出,虽然婴儿尚未掌握具体知识,但人类在漫长进化过程中获得的元学习能力已根植于每个人的基因中。正是这种基因的存在,使人类具备了远超当前人工智能的学习能力。

人工智能可以获得这样的“基因”吗?对于这个问题,耿新团队进行了多年研究。

让模型不必“从零起步”

“要实现不同模型之间知识的‘遗传’,需要满足几个条件。其中,最关键的是学习基因作为模型信息片段不能太大。换言之,要实现信息的高度压缩。”耿新进一步指出,根据人类大脑神经元的数量粗略计算,如果将描述这些神经元所需要的信息量压缩到人类基因组能存储信息量的水平,压缩比要达到惊人的100万:1。

相比之下,目前人工智能系统通过人类算法设计所能实现的压缩比,最多只有约1%。“也就是说,我们可以从一个模型中提取约1%的信息量,并将其传递给新模型,从而使后者具备此前模型的部分功能。”耿新说。

需要注意的是,这些从原模型中提取的信息并非某类具体知识,而是针对人工智能系统的元学习能力。一旦这种信息可以被提取和传递,新一代人工智能便在原本“随机初始化”的基础上,获得了一定的学习基因。

自2022年起,耿新团队便致力于实现这一设想。最终,他们成功设计出一套完整的遗传强化学习框架,用以模拟生命的学习与演化过程。借助该框架,新模型不必完全“从零起步”,即可具备先天能力。

不久前,耿新团队在此前研究的基础上进行了一个有意思的实验。“我们设计了多代智能体种群,每一代智能体在‘出生’时都能够继承前几代的某些学习基因。”耿新介绍。不过,继承过程需经过一定的竞争与淘汰,这几乎模拟了生物种群的繁衍与进化过程。团队将该种群进行了迭代训练,结果发现,“将第1代与第100代智能体进行比较,会发现后者的学习速度快得多,甚至有些四足机器人刚‘出生’便能站立,几乎不会摔倒”。

耿新表示:“这表明,学习基因不仅在效率上显著优于传统模型的训练方式,而且能通过可遗传知识的不断积累而持续进化,使后代模型具备越来越强大的学习潜力。”

可遗传知识的“代际传递”

需要指出的是,虽然学习基因能显著加快人工智能模型的学习速度,但并不意味着最终的学习效果和质量必然优于传统训练方式。

正如耿新所说,“学习基因或许能够提升人工智能模型学习效果的上限,但受限于当前的算力,这一点尚无法得到充分验证”。

即便如此,目前的研究成果仍令人振奋。耿新向《中国科学报》表示,学习基因概念的提出及其潜在影响,可能为人工智能的自我演进奠定基础。

据介绍,现阶段人工智能的代际演进并非自主完成,而是必须依靠人力。比如,科学家需要研发出更新的算法,设计出更先进的网络架构;工程人员则要对训练数据的规模和类型进行调配,对模型的超参数进行调整。这些环节都耗费了大量人力。

“人工智能未来的发展方向之一是实现自主进化和演进,这就要求不同人工智能模型能够形成一种可遗传知识的‘代际传递’。否则,这种演化可能沦为低效的重复计算。”耿新说。

他同时表示,目前关于学习基因的研究仍存在诸多挑战,例如如何实现跨架构的学习基因传递、如何进一步提升信息的压缩比等。无论如何,这一探索方向都值得持续推进。

相关论文信息:https://doi.org/10.1016/j.artint.2025.104421

《中国科学报》 (2025-10-29 第3版 领域)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学家提出“冷冻表界层分析新方法” 真正有助于缓解便秘的食物是它
我国首颗海洋盐度探测卫星完成在轨测试 新型光电神经网络架构让光电计算精度更高
>>更多
 
一周新闻排行
 
编辑部推荐博文