用于传承的声音克隆必须以同意为先

作者:Chris Williams,Afterlife.ai™ 首席执行官兼创始人。· 最后审阅日期:2026年6月4日

声音克隆技术在过去两年中迅速进步。曾经需要数小时高质量录音才能完成的事情,如今只需几秒钟的音频即可实现。被克隆的声音可以说出任何文本。它可以表达任何情感。它可以生成原始说话者从未说过、也未必会认可的话语。

这项技术有其正当用途。它也存在严重风险。在数字传承的语境中,被克隆声音的主人可能已无法表示同意,此时有意义的保存与未经授权的模仿之间的界限,比几乎任何其他领域都更为重要。

本页内容涉及声音克隆如何与传承交汇,同意为先的设计有何要求,以及 Afterlife AI™ 如何看待保存声音与生成声音之间的区别。

,围绕这一话题的公共讨论已经加速。Tom's Guide 作者 Jason England 于2026年2月发表了对 Meta 美国专利 US12513102B2 的评论,该专利描述了一种大型语言模型,可以在用户缺席或去世时对其进行模拟(包括声音和视频)。Microsoft 的同类专利于2021年提交,具有类似的能力。England 点名提到 Afterlife AI™、StoryFile 和 HereAfter AI,称它们是采取不同方法的、以选择加入为基础、专注于传承的服务:声音被保存的本人在其生前选择加入并设定规则。Chris Williams 在 ABC Radio 上与 Nikolai Beilharz 讨论了声音与身份这一更广泛的问题,将其框定为你的数字自我随时间推移会发生什么。

声音克隆究竟是什么

声音克隆使用 AI 来学习一个人言语的声学特征,并以该声音生成新的音频。在现代系统中,通常几分钟干净的参考音频就足以制作出令人信服的克隆。被克隆的声音可以读出任何文本,带有任何强调,采用任何情感语调。

这与声音录制有着根本的不同,后者捕捉的是一个人实际说过的特定语句。录音是固定的产物。克隆是一个生成器。录音永远无法生成此人没有说过的内容。克隆可以生成此人从未说过的、任意大量的内容。

两者都有正当用途。其伦理考量却大不相同。

声音克隆在传承语境中的风险

在缺乏稳固同意与治理的情况下使用声音克隆,可能造成若干危害。

虚假呈现。克隆可以说出此人从未说过、从未认同、甚至积极反对的话。后代或许无法将真实录音与生成内容区分开来。
尊严的丧失。此人的声音可能被用于其本会拒绝的语境。广告。政治内容。虚构情节。情感操纵。
欺诈。声音克隆可被用于冒充、绕过基于声音的身份验证,或针对逝者家属的诈骗通信。
哀伤的干扰。家人听到克隆说出此人从未说过的话语,尤其是在他们无法分辨录音与生成的区别时,可能加剧而非缓解悲痛。
同意规范的侵蚀。每一次未经授权的使用都会让下一次更容易。寻求许可这一文化期待会逐渐瓦解。

这些风险并不意味着声音克隆绝不应在传承中使用。它们意味着其使用比大多数相邻技术需要更多的审慎。

应当适用的同意框架

在传承语境中,任何负责任地使用声音克隆都应满足既定的同意标准。

明确。声音被克隆的本人必须已通过书面或经过验证的选择加入流程明确表示同意。
知情。本人必须理解声音克隆是什么、它能实现什么以及它带来哪些风险。笼统的条款与条件同意是不够的。
具体。本人应当同意既定的用途,而非笼统的许可。用于纪念信息的克隆不同于用于任意话语生成的克隆。
可撤回。本人必须能够在其生前的任何时候撤回同意。
身后受治理。被克隆声音的身后用途必须受到本人生前所配置规则的约束。

Afterlife AI™ 的隐私政策将声音录音及相关敏感数据视为需要明确、知情且可撤回的同意。上述框架是该政策的运营层面落实。

声音保存与声音克隆的对比

值得划出的区别在于声音保存与声音克隆之间。

声音保存捕捉的是此人实际所做的录音。特定的语句。特定的故事。特定的情感语调。这些录音是固定的且可归属的。所听到的内容是否为此人所说,毫无疑问。是他说的。录音可以证明。

声音克隆生成的是此人未曾说过的话语。生成的内容听起来像他。声学指纹相匹配。但话语并非他的。情感语调可能并非他的。所表达的观点可能并非他的。除非这一区别被透明地标明,否则未来的听者无法分辨什么是真实的、什么是生成的。

Afterlife AI™ 的主要机制是声音保存。声音记忆由本人用自己的话语录制,附加到特定的记忆或信息上。家人听到的就是这些录音。关于什么是真实的,不存在任何含糊。

Figure 12. Required conditions and red lines for legacy voice cloning. The framework, and what falls outside it.

声音克隆可能负责任地适用的场合

声音克隆若审慎使用,可以在传承中发挥声音保存所无法发挥的作用。

一个在生前录制了大量内容的人,可能希望家人在特定的未来时刻听到特定的信息,例如孙辈的婚礼、曾孙的二十一岁生日,而这些是他未曾有机会直接录制的。原则上,声音克隆可以被用来以此人的声音传达这些信息。

如果要这样做,就应当在严格的条件下进行。

在本人生前对克隆的明确同意。
由本人在生前撰写的特定脚本,即便传达发生在日后。
向家人明示该话语是生成的,而非原始录制的。
通过以下方式配置的受限用例:Executor Lock™。
家人随时可以要求停止克隆的权利。

没有这些条件,传承语境中的声音克隆在伦理上将无法辩护。

Start your Persona today. A Persona built on who you are. Your stories, your wishes, your values, your likeness, your voice. Create your account free.

不应逾越的红线

声音克隆的某些用途在任何框架下都无法辩护。

未经许可克隆某人的声音,无论其在世还是去世。
生成与此人实际信念相矛盾的话语。
将逝者的声音用于广告、政治宣传或商业代言。
以假装此人仍在世的方式生成对家人提问的回应。
利用克隆的声音在商业或情感上操纵悲痛中的家庭成员。

这些并非边缘情况。它们是草率的声音克隆的核心失败模式。任何允许这些行为、或未能积极防止这些行为的平台,都是在应当规范这项技术的准则之外运营的。

Afterlife AI™ 如何对待声音

Afterlife AI™ 当前的声音处理是围绕保存构建的。用户录制与特定记忆和信息相关联的声音记忆。这些录音就是家人所听到的声音内容。在没有明确、知情、具体的同意以及随附的治理框架的情况下,平台不会以用户的声音生成新的话语。

未来任何向声音克隆能力的扩展都将受到上述框架的治理。同意为先。具体的用例。向家人透明。Executor Lock™约束的权限。红线得到维护。

原则很简单。你的声音属于你。即便在你不再能够为它发声之后,它仍应属于你。

从何处开始

如果声音对你很重要,请从声音保存开始。录制记忆,用你自己的声音。将它们锚定到特定的故事和人物上。打造一个包含你真实声音的 Persona,而非它的一个模型。

如果你想进一步思考克隆,请审慎为之,充分理解它能实现什么以及它有何风险。技术将持续进步。伦理需要跟上。

为何保存是更安全的基础

保存与克隆在技术上相关,但在伦理上截然不同。保存捕捉的是一个人实际说过的语句。克隆生成的是他未曾说过的语句,采用一种模仿他的声音。保存不需要身后同意,因为同意已隐含在录制这一行为之中。克隆需要明确、知情、持续的同意,因为克隆操作所作用的是本人并未亲自产出的材料。

就传承目的而言,保存几乎总是足够的。丧亲者想听到此人以其本人的身份说话,而非听到此人从未有过的对话的模拟延续。从未见过祖父的孙辈,想听他讲述一个他确实讲过的故事,而非用他的声音编造的故事。家人想要的是他们记忆中的声音,而非它的合成延伸。

克隆在传承中有狭窄的正当用途:为失去自己声音的人提供无障碍支持,在严格受限的参数内进行受控的信息生成,在预定时刻传达预先撰写的特定信息。每一种都需要在本人在世时确立的明确同意。没有一种能为出于一般用途而无限制地克隆逝者声音提供正当理由。

Afterlife AI™ 的主要机制是保存。克隆即便提供,也受上述所述框架的限制。默认姿态是保守的,因为默认值就是用户在未特意作出其他选择时所得到的,而传承平台的默认值应当是对声音主人潜在危害最小的那一种。

常见问题

声音克隆用于传承合乎伦理吗?

可以合乎伦理,但前提是在本人生前获得明确、知情、可撤回的同意,并辅以一套针对身后使用的稳固治理框架。

我能否在不克隆的情况下保存我的声音?

可以。声音记忆、引导式录音和口述故事通常是恰当的主要方法。录制特定内容比从克隆生成新内容更安全、更真实。

Afterlife AI™ 会克隆声音吗?

Afterlife AI™ 的主要声音机制是保存。任何对声音克隆能力的使用都将受到上述所述同意框架的治理。

我去世后,家人能否以我的声音生成新内容?

未经你在生前设定的明确同意和配置则不能。Persona 的行为受 Executor Lock™ 权限的约束。

如果我完全不希望我的声音被克隆怎么办?

你可以明确配置这一点。声音克隆是选择加入的。没有你的具体同意,你的声音将按录制原样保存,不用于生成。

相关声音指南:参见声音传承、声音克隆是否安全,以及如何克隆你的声音。

Create your Persona See how it works Contact