更新时间:2021-10-13 08:56:57
大家好,我是本栏目的编辑郝帅,现在就给大家讲解一下上面的问题。人工智能的圣杯是一台真正理解人类语言并从复杂而详细的段落中解读意义的机器。当IBM的沃森电脑打败了著名的Jeopardy!2011年的冠军肯詹宁斯似乎已经达到了这个里程碑。然而,任何试图与虚拟助手Siri交谈的人都知道,计算机在真正理解人类语言之前还有很长的路要走。为了更好地理解语言,计算机系统必须用挑战它们并反映人类语言完全复杂性的问题来训练。
马里兰大学的研究人员已经发现了如何通过人机合作来可靠地开发1200多个问题来创建这样的问题。虽然人们很容易回答,但今天最后最好的电脑回答的是系统的数据集。学习这些问题的系统将比任何现有系统更好地理解语言。这项工作发表在2019年出版的《计算语言学协会学报》上。
该论文的资深作者、UMD大学计算机科学副教授乔丹博伊德-格雷伯(Jordan Boyd-Graber)说:“大多数回答问题的计算机系统都没有解释它们为什么要回答自己的实践,但我们的工作帮助我们理解了计算机实际理解了什么。“此外,我们还制作了一个数据集来测试计算机,这些数据集将揭示计算机语言系统是否真的在读取和执行与人类相同类型的处理。”
目前,改进问答程序的大部分努力都是使用人类作者或计算机来生成问题。这些方法的内在挑战是,当人们写问题时,他们不知道他们的问题的哪些特定元素会混淆计算机。电脑写问题时,要么写公式填空白题,要么出错,有时还会产生废话。
为了开发一种新的方法,让人们与计算机一起工作来创造问题,Boyd-Graber和他的团队创建了一个计算机界面,该界面揭示了计算机“思考”是人类作家键入问题的内容。然后,作者可以编辑他或她的问题,以利用计算机的弱点。
在新的区域,人类作者键入问题,而计算机猜测以排名顺序出现在屏幕上,导致计算机猜测的单词被突出显示。
例如,如果作者写道:“海顿主题作曲家的转变是受卡尔费迪南德波尔的启发吗?”而系统正确回答了“约翰奈斯勃拉姆斯”,界面中突出显示了“斐迪南玻尔”一词,表明这句话触发了它的回答。利用这些信息,作者可以编辑问题,使计算机更难改变问题的含义。在这个例子中,作者替换了启发勃拉姆斯的人的名字“卡尔费迪南波尔”,并描述了他的作品“维也纳博物馆的档案员”,计算机无法正确回答。然而,专业的人类测试游戏玩家仍然可以轻松、正确地回答编辑过的问题。
通过共同努力,人类和计算机已经可靠地开发了1213个电脑拼图,研究人员在比赛中测试了经验丰富的人类玩家——从初中队到高中花絮队,再到“危险!”。对抗计算机冠军。即使是最弱的人类团队也打败了最强大的计算机系统。
“在过去的三四年里,人们已经意识到计算机问答系统非常脆弱,很容易被愚弄,”UMD计算机科学研究生、该论文的合著者石峰说。“但这是我们第一篇意识到我们真的用机器帮助人类打破模式的论文。”
研究人员表示,这些问题不仅可以作为计算机科学家更好地理解自然语言处理失败的新数据集,还可以作为开发改进的机器学习算法的训练数据集。这些问题揭示了六种不同的语言现象,一直困扰着计策。
这六种现象可以分为两类。第一类是语言现象:口译(如“跳崖”而非“跳崖”)、分散注意力的语言或意想不到的背景(如在一些无关内容的线索中提及政治人物的政治)。第二类包括推理技巧:需要逻辑和计算的线索,问题中要素的心理三角测量,或多步骤组合形成结论。
博伊德-格雷伯说:“人类可以进行更多的归纳,看到更深层次的联系。“他们没有无限的计算机内存,但他们仍然有能力看到森林中的树木。对计算机问题进行编目有助于我们理解我们需要解决的问题,这样我们就可以真正让计算机开始透过树木看到森林,并以人类的方式回答问题。”
在此之前还有很长的路要走。博伊德格拉博也是由马里兰大学UMIACS和UMD信息研究和语言科学中心任命的。但是这项工作提供了一个令人兴奋的新工具来帮助计算机科学家实现这个目标。