科学网—从人工智能三盘棋说起

作者：陈德旺来源：中国科学报发布时间：2020-3-19

选择字号：小中大

从人工智能三盘棋说起

■陈德旺

最近，《加强“从0到1”基础研究工作方案》出台，提出了很多切实可行的举措以加强“从0到1”的原创性基础研究，可以说，该方案是之前发布“破除四唯”的组合拳之一。

由于该方案是全国性纲领性文件，以宏观原则和总体思路为主，针对每个具体学科，还需要具体问题具体分析，提出相应的对策。笔者从当下热门的人工智能（AI）学科的发展，总结如何实现“从0到1”基础研究的一些规律。

人工智能自从1956年提出以来，其发展里程并非一帆风顺，走过的道路非常曲折，经历了三落三起。在每一次即将衰落之际，恰巧有一个大专家（团队）临危受命，以一盘棋挽狂澜于既倒，扶大厦之将倾。人生如棋局局新，幸亏棋局AI终复兴。

第一盘棋，是IBM的萨缪尔研制的西洋跳棋AI程序，在1962年击败了当时全美西洋棋冠军，引起了巨大的轰动。

这个AI程序采用了机器学习中的强化学习技术，具有自学习能力，能不断提高弈棋水平。萨缪尔参加了人工智能起点的1956年达特茅斯会议，是AI的创始人之一。他提出了“机器学习”的概念：让机器在学习中不断提高性能，并在跳棋程序中予以实现。

因此，一个AI跳棋程序，实现了两个“从0到1”基础研究：机器学习和强化学习，直到今天还影响深远。据说萨缪尔研究和完善这个程序花了约10年的功夫，做到了十年磨一剑。

跳棋AI程序把AI从谷底拉起，使得AI名声大振，让一众研究者获得更多的支持。但是，跳棋游戏还是有些简单，复杂度不高。之后，虽然上世纪80年代神经网络兴起，但是毕竟解决的都是些简单的问题，大家慢慢对人工智能失去了兴趣。此时，急需AI解决一个高难度的问题以重振士气。

国际象棋比跳棋复杂得多，国际象棋大师是人类智慧的杰出代表。从读博士期间就专注计算机下棋的许峰雄，在IBM公司的支持下，花费约12年时间，终于研发出国际象棋AI程序深蓝，它具有超级运算、快速推理和搜索能力。

1997年5月12日，深蓝击败了棋王卡斯帕罗夫。当时虽然没有移动互联网，也有数以亿计的观众观看了现场直播，AI一时间家喻户晓，也再一次挽救了无数AI研究者和研究项目。

深蓝也有两个“0到1”基础研究：一是将通用处理器和象棋加速芯片相结合，极大地提高了计算和搜索速度；二是汇聚了诸多人类国际象棋大师的知识与智慧，形成了超级专家系统。

在此之后，人工智能的研究又平稳发展了一段时间。虽然在2012年，深度卷积神经网络技术使得图像识别的精度大幅度提高，但是图像识别还局限于人工智能很小的领域，知道的人不太多，在社会上反响不大。

与此同时，人工智能的热度也在逐渐下降。如果任其发展，人工智能有可能再此跌入谷底。这个时候，AI急需一场更大的胜利来鼓舞人心。

围棋是最复杂的棋类，复杂度远超国际象棋，围棋大师是人类智慧的最高代表之一。AlphaGo是由谷歌旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。

2016年3月，在数十亿互联网观众的围观下，AlphaGo以4比1战胜了世界围棋冠军李世石，终于引爆了人工智能，使之家喻户晓，妇孺皆知。

AlphaGO再次实现了两个“从0到1”基础研究突破：将深度学习和强化学习完美结合，形成深度强化学习核心算法；将蒙特卡洛方法与深度强化学习有机结合，快速找到超级复杂问题的次优解。

从这三盘棋，笔者总结人工智能研究“从0到1”基础研究的发展有三个具体思路。

首先，AI研究要挑战各种人类冠军，比如中国象棋冠军、世界桥牌冠军和各类游戏冠军等等。各类人形机器人要与人类选手同场竞技，比如与博尔特比短跑，与费德勒比网球等等。

其次，要公开进行比赛，现场直播，尤其要网上直播，形成社会热点。AI研究水平如何，“是骡子是马要牵出来遛遛”，论文中的结果、仿真中的结果可信度不行，必须真刀真枪地公开比试，类似于我国古代的登台打擂。

最后，要相互比赛，看谁家能独领风骚，一览众山小。比如，谁研究的围棋程序能击败谷歌公司的AlphaGO，我们就承认他的AI研究水平达到了世界领先水平。

http：//blog.sciencenet.cn/u/dwchen

《中国科学报》 (2020-03-19 第8版博客)

编辑部推荐博文
国自然基金，这项优化让你的申请书更“吸睛”！科学网2026年1月十佳博文榜单公布！国防科技大学邵长伟等最新论文同济大学施剑林院士、谢冬、唐忠敏等最新论文手把手教您写出“一眼抓住编辑”的Introduction 深度Q网络算法风冷数据中心多设定点冷却控制法更多>>