谷歌2018年发表了一篇论文,只需要5秒的真人语音,就可以提取语音特征,然后任何文本都可以转成该人的语音。
5 t) @1 W: X1 {% a上面的链接有这种技术合成的很多语音示例,大家可以去听一下,很惊人。
& k" I5 b7 @( r, `3 V4 X: z I
% q* V* j* k% P, k1 k4 Z0 X U2 N2 v! ^: y
% h1 s) z) @* @这种技术要是推广开来,其实挺危险的。我知道一件真人真事,一个同事有一天接到诈骗电话,声称他的小孩被绑架了,要求支付赎金。当然他没有上当,但是如果那些骗子用了谷歌的这种技术,电话里播放一段他儿子的合成语音,恐怕就很容易相信了。
; ^6 i( z2 U- x+ H8 ^- R- k
& c( Y; ~ C/ S t- r! r我还想到一个用途。以后人死了,他的声音还活着,结合人工智能,就可以跟死去的人进行虚拟对话了。* w1 Q$ H; o7 [. z) Y" z6 S# d
4 k+ o0 \# a' N+ O' k" T
美国作家菲利普·迪克写过一本科幻小说《尤比克》(Ubik)。他想象在未来世界,人死后还可以继续以脑电波的形式"存活"一段时间。人们将死去亲友的身体冷冻保存在亡灵馆,活人通过脑电波装置与亡灵的脑电波"对话"。! N0 h' ` j+ [
% b7 t8 D* l( k: V1 J, f4 U% i# N2 `2 p
语音合成技术会像科幻小说那样造成可怕的后果吗
$ U. w, {1 i. Y3 m
& s1 Z, |* S2 g {0 ~+ T
我觉得,现有的技术已经可以实现这个预言了。一个人的生理特征、行为习惯、写过的文章、说过的话,都可以输入计算机生成模型(英语叫做 avatar),得到一模一样的外貌、语音、思考方式、一举一动。其他人跟这个 avatar 互动,好像跟本人互动一样。
! L4 G, r3 w1 e- M& \$ t2 Y. v" q$ ^7 A/ O. A: @
这种模型可以商品化,就像上面说的,人们会愿意购买过世亲人的 avatar,让亲人还活在我们身边。某些名人的 avatar 肯定具有巨大的销路,喜爱偶像的青少年以后不会去听演唱会,而是购买偶像的 avatar,想听什么歌就让它唱给你听。电商平台也会推出排行榜,本周最畅销的 avatar 是谁、又有哪些新进榜等等。
& i: ]( _' x* [ I E0 {% D4 J" Q, I j* W% c% f
转载自阮一峰的博客,原文地址:http://www.ruanyifeng.com/blog/2020/04/weekly-issue-104.html |