反思图灵实验科学家设计挑战多重维度的新比赛—新闻

作者：张章来源：科学网 www.sciencenet.cn 发布时间：2015/1/19 22:53:04

选择字号：小中大

反思图灵实验科学家设计挑战多重维度的新比赛

人工智能何日超越图灵

科学家设计挑战多重维度的新比赛

艾伦·图灵（1950 年）图片来源：FINE ART IMAGES

随着纪念英国数学家艾伦·图灵对第二次世界大战胜利所作贡献的电影《模仿游戏》的上映，人工智能界正在反思图灵的另一个遗产：图灵实验。

1950年，图灵提出了一个简单实验，以检验一台机器能否拥有人的智能水平：当一个人使用文本与计算机交谈时，是否会将它错认成另一个人？但美国Leidos公司计算机学家Leora Morgenstern 表示，60多年后，是时候提出新标准了。“我们现在知道了很多关于人工智能的信息，它需要进一步发展。这是从图灵时代到现在的飞跃。”

Morgenstern和其他研究人员计划在1月25日举行的第29届人工智能发展协会会议研讨会上讨论新图灵“竞赛”建议书。与图灵提出的立见分晓的检验办法不同，新计划将挑战智能有多重维度——从语言理解到社会意识。

多年以来，图灵的最初想法已经发展为一个小型产业，同时也受到越来越多的批评。持续多年的勒布纳人工智能奖等比赛，要求人类“法官”利用文本与一个人或一个电脑程序交谈至少30分钟，然后判断对方的身份。去年6月，人们宣布一个名为Eugene Goostman的电脑程序通过了英国雷丁大学组织的图灵实验，这个扮演了一个13岁乌克兰男孩的电脑程序在5分钟的谈话中骗过了1/3的判断者。

但包括纽约大学认知学家Gary Marcus在内的研究人员认为这样的比赛把奖金置于落俗套的回答和其他诡计上。“这是一个‘小把戏’。”Marcus说，“无法证明这个程序真正智能。”该研讨会的联合组织者Marcus表示，而新的图灵比赛将激励研究人员开发出能更深刻理解这个世界的机器。

其中一个提议的挑战项目集中于常识理解，这对机器而言仍然是苛刻的任务，但对理解语言而言十分重要。这样，“奖品可能不适合装在棕色箱子里，因为它太大了”。人们推断奖品可能需要各方面知识，它们是一个人的第二天性，但难以编入机器。明年秋天首届新图灵挑战赛将启动，这个由企业赞助的温诺格拉德模式挑战将测试机器对语法歧义的理解。

第二个项目是机器视觉。通过借助新的机器学习技术——训练计算机识别物体，谷歌和脸书等机构的研究人员开发出能指导自动驾驶汽车或自动识别任何照片上的任何面孔的算法。但斯坦福大学计算机学家Fei-Fei Li表示，人工智能研究人员希望该机器能理解和推理它们看到的。Li建议该比赛应让机器看图讲故事，例如，计算机不仅能识别咖啡杯等物体，还能注意到杯子已经空了一半，因为有人喝过。这种机器终有一天可能诠释她所谓的“数字时代的暗物质”：图像和视频——现在的搜索引擎和机器人很难弄明白。

加利福尼亚州自然语言细微差别和人工智能实验室计算机学家Charles Ortiz指出，要让机器真正地辅助人们的日常生活，物理运动与语言和知觉技巧流畅地集成必须是混合的一部分。他提议该比赛应让机器和人操作一个机械臂来摆弄玩具。同时，他们将交流自己的行动。正如图灵原始实验设计的那样，一位参与者将评估计算机性能的“人性化”。

哈佛大学计算机学家Barbara Grosz表示，智能有一个更多的维度：团队合作。通过与人类的有效合作，机器将需要知道队友的偏好、适当地分享信息和处理不确定环境。Grosz的比赛建议是在团体活动中将计算机与人进行配对，例如制订健康计划，以测试人们能否忽略自己的伙伴不是人。

该研讨会还将讨论其他更多的比赛建议，旨在检验创造性的长期学习能力。Marcus表示，研讨会的目的是筛选出3~5份比赛建议。哈佛大学计算机学家Stuart Shieber提到，雄心和现实间的平衡十分重要。“你可能想要设计从质量上超过现在人工智能水平的比赛，但现在并不是时候，它就像是在达芬奇时代设置航天技术的X大奖。”他说。

研讨会联合组织者、卡内基·梅隆大学的Manuela Veloso表示，尽管在1月不太可能达成一致，相关议题将在7月举行的另一个人工智能会议上继续讨论。到2016年年初，组织者希望举行一系列试验性比赛，它将不断被修改并定期举行。“如果我们不能迅速行动起来，那么什么也不会发生。”Veloso说，“人们也将丧失动力。”（张章）

以下评论只代表网友个人观点，不代表科学网观点。

�� SSI �ļ�ʱ��

编辑部推荐博文
逻辑混乱的草图，比高温更让人窒息！科学网2025年6月十佳博文榜单公布！热能、势能、光能和射线发电大脑如何从睡眠中醒来，这是个问题不收版面费的C刊 \|对青年学者友好中国科学院纳米能源所王中林院士/翟俊宜等综述更多>>