他花了30年练出的声音,被AI偷走了:谷歌这次摊上大事了

📄 View Markdown source

Cover

他花了30年练出的声音,被AI偷走了:谷歌这次摊上大事了

如果有一天,你打开手机,听到一个AI用你的声音在聊天——语气、节奏、甚至那种微妙的停顿都一模一样——你会是什么感觉?
恐惧?愤怒?还是一种说不出的诡异?

2026年2月15日,美国知名广播主持人David Greene正式起诉了谷歌。

原因很简单,也很可怕:谷歌的AI工具NotebookLM,用了一个听起来跟他一模一样的声音来做播客。

而他本人,从头到尾都不知道这件事。

---

🎙️ 一个前同事的消息,揭开了一切

David Greene不是普通人。

他在美国国家公共广播电台(NPR)工作了几十年,主持过NPR最受欢迎的早间节目《Morning Edition》,现在还在主持政论节目《Left, Right & Center》。他的声音,每天早上陪伴数百万美国人醒来。

对一个广播主持人来说,声音就是一切。就像画家的手、歌手的嗓子、厨师的舌头。

2024年秋天,一个前同事给Greene发了条消息,问他:"你是不是给谷歌的NotebookLM配音了?"

Greene一脸懵:"NotebookLM是什么?"

他去听了那个AI生成的播客。然后,他愣住了。

那个声音,就是他的声音。

不是"有点像",不是"风格相似"。Greene自己的原话是:"uncanny"——令人毛骨悚然的相似。

他的朋友们、同事们听了之后,也都是同样的反应:这不就是David吗?

---

🤖 NotebookLM到底是什么?

可能很多人还不太了解这个工具,简单介绍一下。

NotebookLM是谷歌在2023年推出的一款AI笔记工具。你给它喂一篇论文、一本书、一个网页,它能帮你总结、提问、做笔记。

但真正让它火起来的,是2024年加入的一个功能:AI播客。

你扔进去一份文档,它能自动生成一期"两人对话"的播客节目。一男一女两个AI主持人,你一句我一句,聊得有来有回,自然得吓人。

很多人第一次听的时候都会惊叹:这真的是AI在说话?听起来完全就是两个真人在录节目啊。

打个比方:如果以前的AI语音像是微信上那种机械的"您的快递已到",NotebookLM的AI播客就像是你最喜欢的那档深夜电台节目——有感情、有节奏、有互动。

问题是,这个听起来"太像真人"的声音,到底是从哪里来的?

---

⚖️ 谷歌说没偷,Greene说偷了——谁在说谎?

谷歌的态度很明确:我们否认。

谷歌表示,NotebookLM的声音是通过AI技术合成的,并非复制任何特定个人的声音。

但Greene不买账。他在诉讼中提出了几个关键主张:

第一,相似度不是巧合。 AI合成声音有无数种可能的音色、语调组合,为什么偏偏生成了一个跟他几乎一模一样的? 第二,他的声音数据大量存在于互联网上。 作为NPR的主持人,Greene几十年的广播录音都在网上。谷歌的AI在训练过程中,几乎不可能没有接触过这些数据。 第三,没有任何人联系过他。 没有邮件,没有电话,没有授权协议。如果谷歌真的没有用他的声音,为什么不在训练前就排除掉这些公开录音?
这就好比有人画了一幅画,跟你家客厅墙上挂的照片一模一样,然后告诉你:"纯属巧合,我是凭想象画的。"你信吗?

---

😱 这不是第一次了:还记得斯嘉丽·约翰逊吗?

如果你觉得这个故事听起来有点眼熟,那是因为几乎同样的事情在2024年就发生过一次。

2024年5月,好莱坞影星斯嘉丽·约翰逊公开指控OpenAI:ChatGPT的一个语音选项"Sky",听起来跟她的声音极其相似。

更让她愤怒的是,OpenAI的总裁Sam Altman之前曾亲自联系她,邀请她为ChatGPT配音。她明确拒绝了。 结果没过多久,一个"听起来就是她"的AI声音就上线了。

Altman当时还在社交媒体上意味深长地发了一个词:"Her"——这是2013年那部讲述人类爱上AI的电影名字,而斯嘉丽·约翰逊正是片中AI的配音演员。

最终,OpenAI在压力下撤掉了"Sky"这个声音选项。但双方都没有公布详细的技术证据,这件事也没有真正的法律定论。

现在,Greene vs. 谷歌,可能会成为第一个走完法律程序的AI声音侵权案。

---

🔬 技术上到底是怎么回事?AI怎么"偷"声音的?

要理解这个争议,得先搞清楚一个技术问题:AI语音合成,到底是怎么工作的?

现代AI语音模型的训练过程大致分三步:

```

┌──────────┐ ┌──────────┐ ┌──────────┐

│ 海量语音 │ ──→ │ 学习规律 │ ──→ │ 生成新声 │

│ 数据喂入 │ │ 提取特征 │ │ 音输出 │

└──────────┘ └──────────┘ └──────────┘

```

打个比方:想象AI是一个超级模仿者。你让它听一万个人说话,它会把每个人的声音特征都"消化"掉——语速、音调、停顿习惯、气息感。然后,它能像调鸡尾酒一样,把这些特征混合、重组,生成一个"新"的声音。

问题在于:如果训练数据里某个人的声音占比特别大,生成结果就可能高度接近这个人。

Greene在NPR干了几十年,网上有海量的高质量录音。如果谷歌的训练数据确实包含了这些,那AI"学"出一个酷似Greene的声音,在技术上完全说得通。

这就是争议的核心:

---

🌍 这件事为什么跟你有关?

你可能会想:我又不是广播主持人,这跟我有什么关系?

关系大了。

想想看:你的声音数据在哪里?

这些数据,理论上都可以被用来训练AI。

今天是Greene的声音被复制了,明天呢?

如果AI能用你的声音给你家人打电话、发语音消息,能用你的声音录一段你从未说过的话——这不只是版权问题,这是身份安全问题。

2024年,香港发生过一起案件:诈骗犯用AI伪造了一家公司多位高管的声音和视频,在视频会议上骗走了2亿港币。受害者全程以为自己在跟真人开会。

声音,正在从"你的一部分"变成"可以被复制的数据"。

---

📜 法律准备好了吗?完全没有

这才是最让人不安的地方。

目前,全球范围内没有一部专门保护个人声音不被AI复制的法律。

在美国,有些州有所谓的"公开权"(right of publicity)法,保护名人的肖像、声音不被商业滥用。但这些法律是几十年前为了防止商家未经授权用明星照片打广告而制定的,压根没考虑过AI的情况。

关键的法律灰色地带在于:

| 问题 | 现状 |

|------|------|

| AI训练用了你的声音数据,违法吗? | 没有明确规定 |

| AI生成的声音"像你"但不是"你",算侵权吗? | 没有判例 |

| 谁来举证——你证明AI偷了,还是AI证明没偷? | 不确定 |

| 补偿标准是什么? | 完全空白 |

Greene的这场官司,可能是填补这些空白的第一步。

如果他赢了,将为所有人的"声音权"建立一个先例。如果他输了,那意味着AI公司可以合法地"学习"并复制任何人的声音——只要它们声称这是"AI合成"而非"直接复制"。

---

🔮 更深层的问题:AI时代,"你"还是"你"吗?

往更深了想,这件事触及了一个根本性的哲学问题:

在AI能完美复制你的声音、你的面容、你的写作风格之后,"你"这个人的独特性,还剩下多少?

Greene说了一句很扎心的话:

"My voice is, like, the most important part of who I am."
"我的声音,大概是我这个人最重要的部分。"

对他来说,声音不只是谋生工具,更是身份认同。他花了三十多年打磨自己的播音风格——每一个停顿、每一次语调变化、每一丝情感的细微拿捏。

然后AI用几秒钟就复制了。

这让人想起一个更大的趋势:

我们正在进入一个"复制成本趋近于零"的时代。 而那些花了一辈子磨练出独特技能的人,正在发现自己最珍贵的东西可以被轻易拿走。

---

📊 数据总结

| 关键信息 | 详情 |

|---------|------|

| 事件 | NPR主持人David Greene起诉谷歌 |

| 时间 | 2026年2月15日 |

| 涉及产品 | Google NotebookLM(AI播客功能) |

| 核心指控 | AI复制了Greene的声音,未经授权 |

| 谷歌回应 | 否认复制任何特定个人声音 |

| 类似先例 | 2024年斯嘉丽·约翰逊 vs. OpenAI(未走完法律程序) |

| 法律现状 | 全球无专门的AI声音复制保护法 |

| 香港AI语音诈骗案 | 2024年,AI伪造高管声音骗走2亿港币 |

| Greene在NPR工作年限 | 数十年(具体起始时间未公开确认) |

---

🗣️ 最后说两句

2013年,电影《Her》描绘了一个人类爱上AI声音的未来。那时候大家觉得这是科幻。

2024年,斯嘉丽·约翰逊发现自己的声音被AI"致敬"了。大家觉得这是个案。

2026年,David Greene把谷歌告上了法庭。这一次,没人再觉得这是玩笑了。

你的声音,你的脸,你的文字风格——这些构成"你"的东西,在AI面前正在变成可以被随意抓取、学习、复制的数据。

而保护它们的法律和规则,还远远没有准备好。

也许是时候认真想一想了:在一个什么都能被复制的时代,什么才是真正属于你的?

你怎么看?你觉得AI复制人类声音应该被允许吗?欢迎留言讨论。

---

*参考来源:*