云从科技、上海交通大学联合发布NLP最新成果—新闻

作者：赵广立来源：科学网 www.sciencenet.cn 发布时间：2019/3/8 14:29:17

选择字号：小中大

机器阅读理解首次超越人类高中生

云从科技、上海交通大学联合发布NLP最新成果

3月8日，中科院旗下人工智能创业企业云从科技和上海交通大学联合宣布，双方基于原创算法提出的全新模型，在自然语言处理（NLP）上取得一项重大突破：该模型在大型深度阅读理解任务中取得了超越人类高中生的准确率，成为世界首个机器阅读理解超过人类排名的NLP模型。目前，该成果已在arXiv网站预发布。

研究人员在论文中称，云从科技与上海交通大学基于原创DCMN算法，提出了一种全新的模型，使机器阅读理解正确率提高了4.2%，并在高中测试题部分首次超越人类（机器正确率69.8%、普通人类69.4%）。

该模型这一成绩是在大型深层阅读理解任务数据集RACE数据集上取得的。据了解，RACE是一个来源于中学考试题目的大规模阅读理解数据集，包含了大约2.8万篇文章以及近10万个问题。它的形式类似于英语考试中的阅读理解（选择题），给定一篇文章，通过阅读并理解文章，针对提出的问题从四个选项中选择正确的答案。而且，该题型的正确答案并不一定直接体现在文章中，只能从语义层面深入理解文章，通过分析文章中线索并基于上下文推理，选出正确答案。相对以往的抽取类阅读理解，算法要求更高，被认为是“深度阅读理解”。

云从科技创始人周曦表示，基于这一研究成果，在应用领域搭配文字识别OCR或语音识别技术后，NLP模型将会帮助机器更好地理解人类文字或语言，并广泛应用于服务领域，比如帮助企业判断客户风险、审计内部文档合规、从语义层面查找相关信息；在社交软件、推荐引擎软件内辅助文字审阅工作等，“从枯燥的人工文字工作中解放人类”。

相关论文信息：https://arxiv.org/abs/1901.09381

以下评论只代表网友个人观点，不代表科学网观点。

编辑部推荐博文
封面文章丨禁渔四年，长江中游的鱼回来了吗？科学网2026年4月十佳博文榜单公布！天体的尺度效应这类常见的食物可能会增加你患心脏病的风险常压限域退火提升 Sb₂S₃薄膜太阳能电池结晶性与缺陷钝化大得梅因植物园风物纪实更多>>