谷歌2018年发表了一篇论文,只需要5秒的真人语音,就可以提取语音特征,然后任何文本都可以转成该人的语音。' d4 Y0 D6 ]& O
上面的链接有这种技术合成的很多语音示例,大家可以去听一下,很惊人。- P1 ?2 a% ?$ B5 Z4 ~
2 @7 V% \2 n, d 0 q" x" }6 K6 ~0 V" l* m
+ R) E: ?7 E; o: \- @# r2 a) [, {
这种技术要是推广开来,其实挺危险的。我知道一件真人真事,一个同事有一天接到诈骗电话,声称他的小孩被绑架了,要求支付赎金。当然他没有上当,但是如果那些骗子用了谷歌的这种技术,电话里播放一段他儿子的合成语音,恐怕就很容易相信了。) Y: p% \% }' k( m
8 Z) j* W8 L" K
我还想到一个用途。以后人死了,他的声音还活着,结合人工智能,就可以跟死去的人进行虚拟对话了。
$ Y- j. B& w% C+ Z6 t, ^" k3 K; J; i; B2 z% Y" P: h3 D" ^* }9 {3 Z
美国作家菲利普·迪克写过一本科幻小说《尤比克》(Ubik)。他想象在未来世界,人死后还可以继续以脑电波的形式"存活"一段时间。人们将死去亲友的身体冷冻保存在亡灵馆,活人通过脑电波装置与亡灵的脑电波"对话"。
9 J a; m( z3 G, s3 ~
, w/ l6 c- c1 e3 U6 l
语音合成技术会像科幻小说那样造成可怕的后果吗
" Z3 x p) v* c
: t! r6 m0 f" ~5 R( s
我觉得,现有的技术已经可以实现这个预言了。一个人的生理特征、行为习惯、写过的文章、说过的话,都可以输入计算机生成模型(英语叫做 avatar),得到一模一样的外貌、语音、思考方式、一举一动。其他人跟这个 avatar 互动,好像跟本人互动一样。
; U0 ^" l; W* ?
o1 `& b P7 R0 p, d, q这种模型可以商品化,就像上面说的,人们会愿意购买过世亲人的 avatar,让亲人还活在我们身边。某些名人的 avatar 肯定具有巨大的销路,喜爱偶像的青少年以后不会去听演唱会,而是购买偶像的 avatar,想听什么歌就让它唱给你听。电商平台也会推出排行榜,本周最畅销的 avatar 是谁、又有哪些新进榜等等。
p6 v5 p! x9 P2 t
9 D3 B" c2 B. v转载自阮一峰的博客,原文地址:http://www.ruanyifeng.com/blog/2020/04/weekly-issue-104.html |