作者:赵广立 来源: 中国科学报 发布时间:2019-3-14
选择字号:
云从科技和上海交大联合发布NLP最新成果:
机器阅读理解首次超越人类高中生

 

本报讯 3月8日,中科院旗下人工智能创业企业云从科技和上海交通大学联合宣布,双方基于原创算法提出的全新模型,在自然语言处理(NLP)上取得重大突破:该模型在大型深度阅读理解任务中取得了超越人类高中生的准确率,成为世界首个机器阅读理解超过人类排名的NLP模型。目前,该成果已在arXiv网站预发布。

研究人员在论文中称,云从科技与上海交通大学基于原创DCMN算法,提出了一种全新的模型,使机器阅读理解正确率提高了4.2%,并在高中测试题部分首次超越人类(机器正确率69.8%、普通人类69.4%)。

该模型这一成绩是在大型深层阅读理解任务数据集RACE上取得的。据了解,RACE是一个来源于中学考试题目的大规模阅读理解数据集,包含了大约28000篇文章以及近100000个问题。它的形式类似于英语考试中的阅读理解(选择题),给定一篇文章,通过阅读并理解文章,针对提出的问题从四个选项中选择正确的答案。该题型的正确答案并不一定直接体现在文章中,只能从语义层面深入理解文章,通过分析文章中的线索并基于上下文推理,选出正确答案。相对以往的抽取类阅读理解,算法要求更高,被认为是“深度阅读理解”。

云从科技创始人周曦表示,基于这一研究成果,在应用领域搭配文字识别OCR(光学字符识别)或语音识别技术后,NLP模型将会帮助机器更好地理解人类文字或语言,并广泛应用于服务领域,比如帮助企业判断客户风险、审计内部文档合规、从语义层面查找相关信息;在社交软件、推荐引擎软件内辅助文字审阅工作等,“从枯燥的人工文字工作中解放人类”。(赵广立

《中国科学报》 (2019-03-14 第7版 信息技术)
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
相关新闻 相关论文

图片新闻
科学网2026年2月十佳博文榜单公布! 中国科学家创造柔性热电材料新纪录
我国实现小时级不间断高轨星地激光通信 古代文物暗示了最早的原始文字
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文