环球科创网

Gucciberg项目提供经典的有声读物由AIDeepfake的GucciMane朗读

更新时间:2022-07-14 04:35:35

导读 Karenina)或弗朗兹·卡夫卡(Franz Kafka)的《变形记》(Metamorphosis)被陷阱神古奇·曼尼(Gucci Mane)读给你听,古奇·曼尼是《柠檬水》

Karenina)或弗朗兹·卡夫卡(Franz Kafka)的《变形记》(Metamorphosis)被陷阱神古奇·曼尼(Gucci Mane)读给你听,古奇·曼尼是《柠檬水》和《浪费》等热门歌曲的创作者?好吧,a)这是一个非常具体的愿望,b)这是你的幸运日。

Gucciberg项目是病毒工厂MSCHF的最新产品,它正是这样做的。通过机器学习,MSCHF制作了Gucci Mane的音频深层伪装,阅读了《小女人》到《贝奥武夫》等经典著作。他们全都可以自由聆听,并提供与Gucci Mane多产唱片的艺术品完美融合的书套。

在什么项目Gucciberg的是luridly简单,但为什么是很难回答。如果您不熟悉MSCHF,我建议您从去年开始了解该服装。从本质上讲,他们是由风险投资基金资助的一组创作者,他们制作怪异的东西设计成可以在线传播,例如吱吱作响的鸡嘴和装满约旦河水的Air Max 97运动鞋,其中一些以象征性价格出售。然后他们 ???和利润(大概是通过将服务出售给希望自己制造的产品能够在线传播病毒的公司)。

“ GUCCI的发音遵循非常特殊的节奏”

在与The Verge对话时, MSCHF的Dan Greenberg并没有参与Gucciberg项目背后的动机,但非常乐于谈论机械原理。音频伪造品现在非常普遍(可以听乔伊·罗根(Joe Rogan )的这个克隆作为一个很好的例子),以至于它们已经被用来欺诈。要做到这一点,您只需要大量目标说话的样本数据和正确的神经网络即可学习和复制其举止。

格林伯格说,MSCHF从播客,访谈等中收集了大约六个小时的Gucci Mane音频。然后,他们创建了剪辑的转录,以帮助进行文本到语音(TTS)的过程。这就需要创建一个“ Gucci语音键/词典,以更好地捕捉Gucci Mane特定Argot的特质。”

Greenberg说:“ Gucci的发音遵循非常特殊的节奏-例如,他使用的元音声音种类比您的普通TTS读者要多得多。” “字典将单词分解为音素(离散的语音手势),然后我们的模型将其用作构建模块。因此,举一个简单的例子,我们需要我们的模型知道哪些音节可以在单词之间滑移或彼此融合:它需要知道说“滑音”而不是“谈论”,Gucci字典{T AH1 LMB AW1 T}使我们到达那里,而“谈论”的文字却没有。

结果是令人印象深刻的:尽管结果并不总是完全一致或质量最高,但深深的伪装听起来确实像是他本人。格林伯格说:“我们假冒的Gucci Mane通常听起来像是通过不良的麦克风讲话,或者通过低质量的互联网流讲话,而这在一定程度上是因为在训练数据中,他经常做到这一点。”

格林伯格说,为什么选择Gucci参加这个项目有两个原因:一是说唱歌手有独特的声音,二是Gucciberg双关语太美味了而不能忽略。

格林伯格补充说,MSCHF没有与古奇(Gucci)取得联系以允许使用他的声音。正如网站上的免责声明巧妙地指出的那样,整个项目提出了有关AI假货时代版权的有趣问题。它说:“我们没有写书,我们对此声音深有感触。” “这是侵犯版权吗?是身份盗用吗?用于制作Gucciberg项目的所有培训数据(记录)都可以在网上公开获得。Gucciberg住在那片美丽的灰色地带,那里有新事物,无所不包。” 必然是!The Verge试图通过他的唱片公司与Gucci Mane取得联系,并作出回应,如果我们回音,我们将继续更新此故事。

Gucciberg项目除了快速单击和大声笑外,还有其他功能吗?好吧,不是真的。但这是MSCHF的业务,他们非常擅长。虽然听了几分钟以上的音频结果有些令人迷惑,但格林伯格表示,按需提供的Deepfake名人有声读物的流行世界可能会带来独特的好处。

他说:“每隔一段时间……Gucci Mane的叙述非常随意,确实使文本焕然一新。”他谈到聆听卡夫卡(Kafka)深层变形版《变形记》的好处。“格雷格·萨姆萨(Gregor Samsa)真的是另一个不想起床的家伙,您知道吗?”

免责声明:本文由用户上传,如有侵权请联系删除!