作者:陈德旺 来源: 中国科学报 发布时间:2020-3-19
选择字号:
从人工智能三盘棋说起

 

陈德旺

最近,《加强“从0到1”基础研究工作方案》出台,提出了很多切实可行的举措以加强“从0到1”的原创性基础研究,可以说,该方案是之前发布“破除四唯”的组合拳之一。

由于该方案是全国性纲领性文件,以宏观原则和总体思路为主,针对每个具体学科,还需要具体问题具体分析,提出相应的对策。笔者从当下热门的人工智能(AI)学科的发展,总结如何实现“从0到1”基础研究的一些规律。

人工智能自从1956年提出以来,其发展里程并非一帆风顺,走过的道路非常曲折,经历了三落三起。在每一次即将衰落之际,恰巧有一个大专家(团队)临危受命,以一盘棋挽狂澜于既倒,扶大厦之将倾。人生如棋局局新,幸亏棋局AI终复兴。

第一盘棋,是IBM的萨缪尔研制的西洋跳棋AI程序,在1962年击败了当时全美西洋棋冠军,引起了巨大的轰动。

这个AI程序采用了机器学习中的强化学习技术,具有自学习能力,能不断提高弈棋水平。萨缪尔参加了人工智能起点的1956年达特茅斯会议,是AI的创始人之一。他提出了“机器学习”的概念:让机器在学习中不断提高性能,并在跳棋程序中予以实现。

因此,一个AI跳棋程序,实现了两个“从0到1”基础研究:机器学习和强化学习,直到今天还影响深远。据说萨缪尔研究和完善这个程序花了约10年的功夫,做到了十年磨一剑。

跳棋AI程序把AI从谷底拉起,使得AI名声大振,让一众研究者获得更多的支持。但是,跳棋游戏还是有些简单,复杂度不高。之后,虽然上世纪80年代神经网络兴起,但是毕竟解决的都是些简单的问题,大家慢慢对人工智能失去了兴趣。此时,急需AI解决一个高难度的问题以重振士气。

国际象棋比跳棋复杂得多,国际象棋大师是人类智慧的杰出代表。从读博士期间就专注计算机下棋的许峰雄,在IBM公司的支持下,花费约12年时间,终于研发出国际象棋AI程序深蓝,它具有超级运算、快速推理和搜索能力。

1997年5月12日,深蓝击败了棋王卡斯帕罗夫。当时虽然没有移动互联网,也有数以亿计的观众观看了现场直播,AI一时间家喻户晓,也再一次挽救了无数AI研究者和研究项目。

深蓝也有两个“0到1”基础研究:一是将通用处理器和象棋加速芯片相结合,极大地提高了计算和搜索速度;二是汇聚了诸多人类国际象棋大师的知识与智慧,形成了超级专家系统。

在此之后,人工智能的研究又平稳发展了一段时间。虽然在2012年,深度卷积神经网络技术使得图像识别的精度大幅度提高,但是图像识别还局限于人工智能很小的领域,知道的人不太多,在社会上反响不大。

与此同时,人工智能的热度也在逐渐下降。如果任其发展,人工智能有可能再此跌入谷底。这个时候,AI急需一场更大的胜利来鼓舞人心。

围棋是最复杂的棋类,复杂度远超国际象棋,围棋大师是人类智慧的最高代表之一。AlphaGo是由谷歌旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。

2016年3月,在数十亿互联网观众的围观下,AlphaGo以4比1战胜了世界围棋冠军李世石,终于引爆了人工智能,使之家喻户晓,妇孺皆知。

AlphaGO再次实现了两个“从0到1”基础研究突破:将深度学习和强化学习完美结合,形成深度强化学习核心算法;将蒙特卡洛方法与深度强化学习有机结合,快速找到超级复杂问题的次优解。

从这三盘棋,笔者总结人工智能研究“从0到1”基础研究的发展有三个具体思路。

首先,AI研究要挑战各种人类冠军,比如中国象棋冠军、世界桥牌冠军和各类游戏冠军等等。各类人形机器人要与人类选手同场竞技,比如与博尔特比短跑,与费德勒比网球等等。

其次,要公开进行比赛,现场直播,尤其要网上直播,形成社会热点。AI研究水平如何,“是骡子是马要牵出来遛遛”,论文中的结果、仿真中的结果可信度不行,必须真刀真枪地公开比试,类似于我国古代的登台打擂。

最后,要相互比赛,看谁家能独领风骚,一览众山小。比如,谁研究的围棋程序能击败谷歌公司的AlphaGO,我们就承认他的AI研究水平达到了世界领先水平。

http://blog.sciencenet.cn/u/dwchen

《中国科学报》 (2020-03-19 第8版 博客)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
大规模基因研究重绘开花植物的生命之树 彭慧胜院士团队把“充电宝”做成衣服
缓解肠易激综合征  饮食比服药更有效 银河系发现巨大黑洞
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文