作者:徐锐 来源: 中国科学报 发布时间:2020-12-2
选择字号:
论文“太长不想读”?人工智能新软件可生成一句话摘要

 

TLDR软件为科学搜索引擎“语义学者”上的一篇计算机科学论文生成一句话摘要。图片来源:Agnese Abrusci/Nature

论文太长不想读怎么办?一个软件就可以搞定。

据《自然》报道,一位科学搜索引擎的创造者推出了一款软件,可自动为研究论文概括生成一句话摘要,他们说,这有助于科学家更快地浏览论文。

这个免费工具被创建它的团队称为TLDRs(“太长,没读过”的缩写),已于日前在科学搜索引擎“语义学者”上投入使用。“语义学者”是美国艾伦人工智能研究所(AI2)创建的搜索引擎。

AI2语义学者小组管理者Dan Weld表示,目前,TLDR软件只用于语义学者所涵盖的1000万篇计算机科学论文,软件经过微调后——预计在12月左右,其他学科的论文应该也能通过该软件自动生成一句话摘要。

初步测试表明,与查看标题和普通论文摘要相比,TLDR软件能够帮助读者更快对搜索结果进行排序,尤其是在手机上。“人们似乎真的很喜欢这个工具。”Weld说。

Weld创造TLDR软件的灵感来源于同事在推特上分享的一些标记文章的简短句子。与其他语言生成软件一样,该工具采用基于大量文本的深层神经网络学习。研究团队创建了数万篇与标题匹配的研究论文,这样网络就可以学会生成简洁的句子。然后,研究人员对该软件进行微调,训练一个新的数据集,将论文和摘要匹配起来,这些数据集由几千篇计算机科学论文组成,其中一些论文的摘要由论文作者撰写,另一些论文摘要则由本科生撰写。该团队已经收集了一些培训实例,以提高该软件在其他16个研究领域的性能,其中生物医学可能是第一位的。

一份描述TLDR软件的论文4月1日在预印本平台arXiv上首次发布,并在11月接受同行评审后发表。研究人员已经免费提供了代码,还有一个可以使用该软件的演示网站,任何人都可以试用这个工具。

“我预测这种工具在不久的将来会成为学术搜索的标准功能。事实上,考虑到需求,我很惊讶过了这么久才将其投入实际应用。”华盛顿大学信息科学家Jevin West说,他应《自然》的要求对该工具进行了测试。“这个工具并不完美,但绝对是朝着正确方向迈出的一步。”(徐锐)

《中国科学报》 (2020-12-02 第2版 国际)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
听导师的话,毕业论文答辩这样准备 大规模基因研究重绘开花植物的生命之树
彭慧胜院士团队把“充电宝”做成衣服 缓解肠易激综合征  饮食比服药更有效
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文