谷歌2018年发表了一篇论文,只需要5秒的真人语音,就可以提取语音特征,然后任何文本都可以转成该人的语音。
' v9 @9 H9 {* |9 a O6 B9 `上面的链接有这种技术合成的很多语音示例,大家可以去听一下,很惊人。) v9 e& m" K7 c* ] V$ ] A6 s
. b4 d; s% V z# B% K" F& @" }

& k8 A1 s+ R- {( S) V& c. x% o8 B+ O: K5 g: V; O
这种技术要是推广开来,其实挺危险的。我知道一件真人真事,一个同事有一天接到诈骗电话,声称他的小孩被绑架了,要求支付赎金。当然他没有上当,但是如果那些骗子用了谷歌的这种技术,电话里播放一段他儿子的合成语音,恐怕就很容易相信了。1 O9 Q. K4 w0 S- T7 N7 D3 A
' J6 L' E/ N V我还想到一个用途。以后人死了,他的声音还活着,结合人工智能,就可以跟死去的人进行虚拟对话了。
0 _$ j/ }* X( C' W3 E, d# P' M/ |& E) u. q' G0 Q/ f5 _' p# A+ D
美国作家菲利普·迪克写过一本科幻小说《尤比克》(Ubik)。他想象在未来世界,人死后还可以继续以脑电波的形式"存活"一段时间。人们将死去亲友的身体冷冻保存在亡灵馆,活人通过脑电波装置与亡灵的脑电波"对话"。
V* N2 ]; P) Q" b. C) f8 h/ r
* y& e& ?3 s6 k K- G8 X3 a* `
语音合成技术会像科幻小说那样造成可怕的后果吗
/ ~4 j$ d& I- l+ l% t" j
+ d& {& b* i$ W/ c/ o& b# k我觉得,现有的技术已经可以实现这个预言了。一个人的生理特征、行为习惯、写过的文章、说过的话,都可以输入计算机生成模型(英语叫做 avatar),得到一模一样的外貌、语音、思考方式、一举一动。其他人跟这个 avatar 互动,好像跟本人互动一样。( G1 N ~3 L( m' n
8 ~ i' T9 b: I1 p! e- Z6 S
这种模型可以商品化,就像上面说的,人们会愿意购买过世亲人的 avatar,让亲人还活在我们身边。某些名人的 avatar 肯定具有巨大的销路,喜爱偶像的青少年以后不会去听演唱会,而是购买偶像的 avatar,想听什么歌就让它唱给你听。电商平台也会推出排行榜,本周最畅销的 avatar 是谁、又有哪些新进榜等等。9 J, R$ J3 y7 L# n+ V4 d
1 ?+ D, G9 k: b$ D. n* K: K% i0 R转载自阮一峰的博客,原文地址:http://www.ruanyifeng.com/blog/2020/04/weekly-issue-104.html |
|