更新时间:2021-10-13 08:21:00
大家好,我是本栏目的编辑郝帅,现在我来给大家讲解一下上面的问题。该领域的一项新评论称,认为面部表情和情绪可靠对应的观点是没有根据的。随着人工智能被用来对我们的生活做出更多的决定,工程师们找到了一种方法,让它变得更加情绪化和智能化。这意味着自动化一些人类自然发生的情感任务——最明显的是,看着一个人的脸,知道他们的感受。
为了实现这个目标,微软、IBM、亚马逊等科技公司都在出售他们所谓的“情感识别”算法,这种算法可以根据面部分析来推断人们的感受。例如,如果有人皱眉,噘起嘴唇,这意味着他们生气了。如果他们的眼睛很大,他们的眉毛会扬起,嘴巴会很紧,这意味着他们会害怕,等等。
客户可以通过多种方式使用这项技术,从寻找“愤怒”威胁的自动监控系统,到有望消除无聊和不感兴趣的求职者的求职面试软件。
许多科技公司出售算法,并承诺他们可以根据某人的脸可靠地读取情绪。图片:微软。
然而,我们很容易看出,他们如何看待人们的感受是有争议的,对这项研究的一个重要的新评论表明,没有坚定的科学理由。
东北大学心理学教授、该评论的五位作者之一丽莎费尔德曼巴雷特(Lisa Feldman Barrett)在接受《The Verge》采访时表示:“公司可以说任何他们想说的话,但数据很清楚。“他们可以发现皱眉,但这和察觉愤怒不一样。”
评估是由心理科学协会委托的,并要求该领域的五位杰出科学家仔细检查证据。每个评论家代表了情感科学领域不同的理论阵营。巴雷特说:“我们不确定我们是否能就数据达成一致,但我们做到了。他们花了两年时间检查数据,审查了1000多项不同的研究。
他们的发现非常详细——在这里可以完全读懂——但基本结论是,情绪是以多种方式表达的,这使得很难从一组简单的面部动作中可靠地推断出某人的感受。
巴雷特说:“平均而言,数据显示,人们生气时皱眉的比例不到30%。“所以皱眉不是愤怒的表现;它们是愤怒的表现——许多人的一种。这意味着70%以上的时候,人在生气的时候不会皱眉头。最重要的是,当他们不生气的时候,他们经常皱眉。”
“你真的想在此基础上确定结果吗?”
反过来,这意味着用人工智能以这种方式评估人们情绪的公司会误导消费者。“你真的想在此基础上确定结果吗?”巴雷特说。“你想在法庭上,就业情况下,医疗诊断,还是在机场.算法准确率只有30%?”
当然,评论并不否认可能存在普通或“原型”的面部表情,也不否认我们对面部表情交际能力的信念在社会中发挥的巨大作用。别忘了,当我们用自己的眼睛看人时,我们对情感背景的了解比简单的面部分析要多。)
评论承认在情感研究领域有各种各样的信念。具体而言,它驳斥了通过表达可靠地“指纹化”情绪的观点,这一观点源于心理学家保罗埃克曼(Paul ekman)在20世纪60年代的工作(此后由埃克曼发展而来)。
研究表明,一些面部表情和情绪之间有很强相关性的研究往往在方法上存在缺陷。比如他们用演员拉夸张的脸作为情绪“看”的起点。当被试被要求标记这些表情时,往往会被要求从有限的情感选择中进行选择,从而促使他们达成一定的共识。
当人们被要求在脸上标记情绪,而不给出一组选择时,他们的答案会大不相同,如图所示。图:巴雷特等人。
巴雷特说,人们对情绪的直观理解比这更复杂。她说:“当我对人们说,‘有时你愤怒地大喊大叫,有时你愤怒地哭泣,有时你大笑,有时你静静地坐着,计划敌人的死亡’,这让他们信服。“我说,‘听着,当他们生气的时候,有人因为皱眉头而获得奥斯卡奖?没有人认为这是一场精彩的表演。"
然而,销售情感分析工具的公司很少认识到这些微妙之处。例如,在微软算法市场,该公司表示,人工智能的进步使其软件能够“识别八种核心情绪状态”.根据反映这些感觉的普遍面部表情”,这是确切的要求,这篇评论驳斥了这一点。
当然,这不是新的批评。多年来,巴雷特等人一直警告说,我们的情绪识别模型过于简单。作为回应,销售这些工具的公司经常说,他们的分析基于更多的信号,而不仅仅是面部表情。困难在于知道这些信号是如何平衡的,如果有的话。
200亿美元情感识别市场的龙头企业之一Affectiva表示,正在努力收集更多指标。例如,去年,它推出了一种结合面部和声音分析来测量司机情绪的工具。其他研究人员正在研究步态分析和眼睛跟踪。
标。在一份声明中,Affectiva首席执行官兼联合创始人Rana el Kaliouby表示,这次审查与该公司的工作“非常一致”。“就像本文的作者一样,我们不喜欢这个行业的天真,它注重于6种基本情绪和面部表情与情绪状态的原型一对一映射,”el Kaliouby说。“表达与情感的关系非常细微,复杂而不是原型。”
Barrett相信,通过更复杂的指标,我们将能够更准确地衡量未来的情绪。“我绝对相信这是可能的,”她说。但这并不一定会阻止目前有限的技术扩散。
AI非常适合在数据中查找虚假连接
特别是在机器学习的情况下,我们经常会看到用于制定决策的指标 - 不是因为它们可靠,而是因为它们可以被衡量。这是一种擅长寻找联系的技术,这可能会导致各种虚假的分析:从扫描保姆的社交媒体帖子到检测他们的“态度”,分析公司财报记录,试图预测股票价格。通常,人工智能的提及给人一种不值得信任的外表。
如果情绪识别变得普遍,那么我们就会接受它并改变我们的行为以适应其失败。就像人们现在的行为知识一样,他们在网上做的事情会被各种算法解释(例如,选择不喜欢Instagram上的某些图片,因为它会影响你的广告),我们最终可能会因为我们的夸张面部表情知道它们将如何被机器解释。这与向其他人发出信号的情况并无太大差别。
巴雷特说,或许从评论中最重要的一点是,我们需要以更复杂的方式思考情绪。情绪的表达是多种多样的,复杂的和情境的。她将所需的思维变化与查尔斯达尔文关于物种性质的研究以及他的研究如何推翻了对动物王国的简单化观点进行了比较。
“达尔文认识到物种的生物类别没有本质,它是一类高度可变的个体,”巴雷特说。“情绪类别完全相同。”