环球科创网

训练有素的AI阅读科学论文如何预测未来的发现?

更新时间:2021-10-12 18:37:32

导读 大家好,我是本栏目的编辑郝帅。现在我将向您解释上述问题。大约70年前,著名数学家、代码毁灭者、计算机科学家艾伦图灵(Alan Turing)曾

大家好,我是本栏目的编辑郝帅。现在我将向您解释上述问题。大约70年前,著名数学家、代码毁灭者、计算机科学家艾伦图灵(Alan Turing)曾问:“机器会思考吗?”如今,一些专家毫不怀疑人工智能将很快能够发展出人类拥有的那种通用智能。但也有人认为机器永远无法达到预期的目标。虽然在某些任务上,人工智能可以超越人类,就像计算器一样,无法教会人类创造力。

毕竟,我们的创造力有时是由激情和直觉驱动的,而不是逻辑和证据,这使我们能够做出惊人的发现——从疫苗到基本粒子。当然,人工智能永远不会竞争吗?事实证明他们可能会这么做。最近发表在《自然》杂志上的一篇论文指出,人工智能现在可以通过简单地从研究出版物中提取有意义的数据来预测未来的科学发现。

语言和思维之间有着深刻的联系,它塑造了人类社会和人际关系,最终影响了智力。因此,人工智能研究的圣杯是充分理解人类语言的所有细微差别也就不足为奇了。自然语言处理是机器学习的一个重要组成部分,旨在评估、提取和评估文本数据中的信息。

孩子们通过反复试验与周围的世界互动学习。学习骑自行车经常会遇到一些颠簸和摔倒。换句话说,我们犯错误并从中吸取教训。这正是机器学习的工作原理,有时它需要一些额外的“教育”输入(有监督的机器学习)。

例如,人工智能可以通过从许多单独的例子中构建对象的图片来学习识别图像中的对象。在这里,人类必须向他们展示它们是否包含物体的图像。然后,计算机会进行猜测,并根据猜测的准确性(由人类判断)调整统计模型。但是,我们也可以让计算机程序自己完成所有相关的学习(无监督机器学习)。在这里,人工智能自动开始检测数据中的模式。在任何情况下,计算机程序都需要通过评估错误的程度来找到解决方案,然后尝试调整它以最小化这种错误。

假设我们想知道一些与特定材料相关的特性。显而易见的步骤是从书籍、网页和任何其他合适的资源中搜索信息。然而,这很耗时,因为它可能涉及几个小时的互联网搜索、阅读文章和专业文献。NLP可以帮助我们。通过复杂的方法和技术,计算机程序可以从大型文本数据集中识别概念、相互关系、一般主题和特定属性。

在这项新的研究中,人工智能学会了通过无监督学习从科学文献中检索信息。这有着重大的意义。到目前为止,大多数基于自然语言处理的自动方法都是有监督的,需要人工输入。虽然与纯手工方法相比,它仍然是一项劳动密集型的工作。

然而,在这项新的研究中,研究人员创建了一个能够独立准确地识别和提取信息的系统。它使用基于数据统计和几何特征的复杂技术来识别化学名称、概念和结构。这是基于大约150万篇材料科学科学论文的摘要。

然后,机器学习程序根据“元素”、“能量学”和“粘合剂”等特定特征对数据中的单词进行分类。例如,“热”被归类为“能量学”的一部分,“气体”被归类为“元素”。这有助于将一些磁性类型的化合物和其他材料的相似性联系起来,从而在没有人工干预的情况下提供关于单词如何相关的见解。

科学发现

这种方法可以捕捉复杂的关系,识别不同的信息层,这对于人类来说实际上是不可能的。与科学家目前所能预测的相比,它提前提供了深刻的见解。事实上,人工智能可以在实际被发现前几年推荐用于功能应用的材料。有五个这样的预测,都是基于2009年之前发表的论文。例如,人工智能设法识别出一种叫做铯镓硒的物质作为热电材料,科学家们直到2012年才发现这种物质。因此,如果AI在2009年左右出现,可能会加快发现的速度。

它通过将化合物与“硫属元素化物”(含有“硫属元素化物”的材料,如硫或硒)、“光伏”(发射、检测和控制光的电子设备)和“光伏应用”等词联系起来进行预测。很多热电材料都有这个特性,AI很快就证明了这一点。

这表明关于未来发现的潜在知识已经在很大程度上嵌入到过去的出版物中。人工智能系统越来越独立。没什么好担心的。它们可以极大地帮助我们浏览人类活动产生的大量数据和信息。虽然与隐私和安全有关,但人工智能正在改变我们的社会。我相信它会引导我们做出更好的决定,改善我们的日常生活,最终让我们变得更聪明。

免责声明:本文由用户上传,如有侵权请联系删除!