■赵广立
10月19日,《自然》杂志刊登了谷歌DeepMind团队新成果,一个名为AlphaZero(阿尔法元)的机器人完全靠增强型自我学习,只训练了3天就战胜了AlphaGo(阿尔法狗),比分是100:0。
阿尔法元无师自通、零基础“自学成才”,许多人闻讯瞠目结舌。有人说:“过去我们相信‘知识就是力量’,现在看来,数据和机器学习比知识和人类经验更有力量。”甚至悲观地认为:人工智能以后可能就不需要“人类师父”了。
果真如此吗?答案显然是否定的。阿尔法元虽然确实通过机器学习超越了人类经验,发现了人类专家还未探索过的博弈路径,但并未否定人工智能机器人仍需要人类经验和知识。
阿尔法元的突破之处在于,第一次让机器在不“学习”任何棋谱、只设定规则的情况下,从“一张白纸”的状态开始,迅速成为“围棋大师”。与阿尔法狗不同,阿尔法元完全摒弃了阿尔法狗学习人类经验、变身许多围棋高手的集大成者的那一套做法,而是无监督的自我博弈、学习,在这个过程中,自己是自己的老师。
这也只表明,在某些特定领域——例如有明确规则的围棋——人工智能或许不再需要人类知识。但这并不表明,人工智能完全不需要人类知识的指引。在日前曙光公司举办的智能峰会上,中国工程院院士李国杰就此发表了看法,他认为,一方面,我们绝不能低估机器学习的强大威力——对于结构性的问题,比如蛋白质折叠、寻找新材料等,无需人类知识的机器学习可能会取得令人惊叹的新突破;另一方面,对于规则不明确的探索未知的研究工作,领域知识仍然十分重要,不能无限夸大机器的能力。
人工智能发展至今,已进入2.0时代的轨道。但在人工智能基础理论领域,仍存在许多未知等待人类去探索。美国“曼哈顿工程”的负责人奥本海默在二战胜利以后曾说过这样一段话:“(在二战期间)我们得到了一棵硕果累累的大树,并拼命地摇晃,结果得到了雷达和原子弹……其全部精神实质在于对已知的疯狂而粗暴掠夺,而毫无对未知的认真而谦恭的探索。”
这段话之于当下人工智能的发展仍有启发。经过60年的培育,人工智能已经长成硕果累累的大树。我们是拼命地摇晃这棵大树,在地上捡一些零星的果实,还是怀抱着对未知的认真和谦恭,自己新种几棵树苗?答案不言自明。
事实上,在人工智能领域,非常需要更多的“领域知识”。比如,深度学习为何如此有效?现在还没人能讲得清楚。以色列学者提出,深度学习和量子力学中的“物理重整化”几乎是完全相同的过程。像这类非常基础的根本性的问题,还需要“人类师父”继续探路。
《中国科学报》 (2017-11-02 第5版 技术经济周刊)