日记大全

日记大全 > 句子大全

太长不看:一句话概括论文(这个AI有点东西)

句子大全 2023-11-21 03:22:01
相关推荐

某搜索引擎的论文总结工具可以使浏览论文变得更简单。

某科研搜索引擎的开发者推出了一款可以自动用一句话概括论文的软件,他们说该软件可以帮助科学家更快地浏览论文。

这款免费工具可以生成团队称之为TLDR(网络流行语“Too long, didn’t read”的首字母缩写)的一句话总结,近日已在非营利性的艾伦人工智能研究所(AI2)开发的搜索引擎Semantic Scholar上线。目前,该软件只适用于Semantic Scholar收录的1000万篇计算机科学论文,但是再过一个月左右,等软件调试完毕后,它也将适用于其他学科论文,艾伦人工智能研究所Semantic Scholar工作组负责人Dan Weld说。

Weld说初步测试显示,该软件能让读者以比浏览标题和摘要更快的速度梳理搜索结果,尤其是在手机上,“大家看起来挺喜欢它的。”

科研搜索引擎Semantic Scholar的TLDR工具可以用一句话总结计算机科学论文。来源:Agnese Abrusci/Nature

4月,arXiv预印本服务器首先发布了描述该软件的论文,11月在一场自然语言处理大会上经过同行评议后,论文已被接收发表。研究人员已经免费公开代码和演示网站,任何人都可以试用。

“我预计未来这种工具将成为学术检索的标配。事实上,考虑到这方面的需求,直到现在才看到这种工具面世,让我挺诧异的。虽然它不完美,但是方向绝对是对的。”华盛顿大学的信息科学家Jevin West说,他应《自然》的请求,对该软件进行了测试。

Semantic Scholar的搜索结果附带TLDR总结,图为智能手机视图。来源:Semantic Scholar

Weld开发TLDR软件的灵感有一部分来自他的同事,这些同事会用一些精炼的语句在推特上介绍论文。和其他语言生成软件一样,这种工具采用的是经过大量文本训练的深度神经网络。该团队收录了上万篇与标题匹配的研究论文,使神经网络可以学习如何生成简洁的句子。之后,研究人员对软件进行了微调,并利用一套新的数据集进行训练,数据集包含几千篇计算机科学论文和相应的论文总结——部分由论文作者所写,部分由一群本科生所写。研究人员已经收集了另外16个领域的训练实例,以提高软件的性能;预计生物医学论文的总结功能会最先推出。

TLDR软件不是唯一的科学论文总结工具:Paper Digest网站自2018年起就开始提供论文总结,但是它似乎只是从原论文中提取关键句子,而非生成新的句子,Weld说。TLDR可以从论文摘要、引言和结论中生成一句话——基于正文内的关键词组,因此,这些总结完全以已经理解论文术语的专业读者为目标。但是,Weld说他的团队也在开发面向非专业读者的论文总结生成软件。

研究团队还计划把这项技术授权给出版商,拓展它们的服务范围,为领域内的关键论文提供个性化研究摘要。“我们才刚刚达到AI技术生成的创新论文总结能够为人所接受的这一步。”Weld说。

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新