更新时间:2022-12-18 09:40:37
一个报告从比利时公共广播公司VRT NWS曾透露支付给抄写由谷歌的AI助手收集的音频剪辑承包商如何结束倾听用户信息,包括姓名,地址,以及他们的个人生活细节的敏感信息。
这是最新的故事,展示了我们与AI助手的互动并不像我们想要的那样私密。今年早些时候,Bloomberg的一份报告揭示了有关亚马逊Alexa的类似细节,解释了如何在没有用户知情的情况下将Echo设备录制的音频片段发送给人工承包商,后者为了改善公司的AI系统而转录所说的内容。
与ALEXA和GOOGLE智能助理的对话不是私密的
更糟糕的是,这些音频剪辑通常完全是偶然记录的。通常,像Alexa和Google智能助理这样的AI助手只有在听到他们的唤醒词时才会开始录制音频(例如,“Okay Google”),但这些报告显示设备经常会错误地开始录制。
在由VRT NWS撰写的关于荷兰语和佛兰芒语Google助手用户的故事中,该广播公司审查了大约一千张唱片,其中153张被意外捕获。一位承包商告诉该出版物,他每周都会从Google智能助理中录制大约1,000个音频片段。在他评论的其中一个片段中,他听到了一位遇难的女声,并说他觉得涉及“身体暴力”。“然后它变成了你正在倾听的真人,而不仅仅是声音,”承包商说道。
科技公司表示,将音频片段发送给人类进行转录是改善语音识别技术的重要过程。他们还强调,只有一小部分录音以这种方式共享。Google的一位发言人告诉Wired,所有录音中只有0.2%是由人类转录的,并且这些音频片段从未提供有关用户的识别信息。
但是,这并不能阻止个人在录音中泄露敏感信息。公司肯定不会对这个转录过程有所了解。例如,Google Home的隐私政策页面未提及该公司对人工承包商的使用,或Home可能错误地记录用户的可能性。
伦敦艾伦图灵研究所的技术隐私研究员迈克尔维尔说,这些混淆可能会给公司带来法律麻烦。他告诉Wired,这种披露水平可能不符合欧盟GDPR规定的标准。“你必须非常具体地了解你正在实施什么以及如何实施,”维尔说。“我认为谷歌没有这样做,因为它看起来会令人毛骨悚然。”
在当天晚些时候发布的博客文章中,谷歌为使用人力资源员工审查助理音频对话的做法辩护。该公司表示,它在整个审核过程中采用了“广泛的保护措施来保护用户隐私”,并且这项审核工作旨在改进智能助理的自然语言处理及其对多种语言的支持。但是,对于向VRT NWS提供音频的比利时合同工的情况,谷歌也承认这些保障措施的失败,在此过程中打破了公司的数据安全和隐私规则。
“我们刚刚得知其中一位语言评论员通过泄露机密的荷兰语音频数据违反了我们的数据安全政策,”Google搜索团队的产品经理David Monsees写道,他撰写了博客文章。“我们的安全和隐私响应团队已经在这个问题上被激活,正在调查,我们将采取行动。我们正在对这个空间的保障措施进行全面审查,以防止这种不当行为再次发生。“