声音也能PS 教你如何调节音色!


 

    近日 Adobe 展示了一项能够编辑录音的黑科技,该技术不仅可以使原话“改口”,还能以相同的“嗓音”创造出新的句子。基于此,这项技术被称为“音频PS”。

除了修图, Adobe还能“修

    这项技术属于混录VoCo(音频转换)。
   首先,用户界面里有一个文本框。文本框内显示的是最初录入的音频文本。用户能够自由编辑字段,调序增删,或者干脆直接敲进新的词句。键入新词后需略等片刻,待新的语音生成后,便可按播放键收听到编辑后的音频片段。

    VoCo施展超能力之前,需要先大剂量“服用”目标人的语音数据(当前版本需要约20分钟左右长度,完善后所需时间应该会有所改善),将其分解成音素(即构成口语的每一个不同的声音元素)。在此基础上VoCo会对目标人的语言特点进行建模,理论上说应该包含目标人的语速、重音分布、怪癖等,对此 Adobe 方面并没有透露很多。

<img data-cke-saved-src="http://www.99down.com/uploadfile/2016/1111/20161111043949565.bmp" src="http://www.99down.com/uploadfile/2016/1111/20161111043949565.bmp" img_width="639" img_height="491" alt="除了修图, Adobe还能“修" 你的话"="" style="width: 639px; height: 491px;">

    随后,当编辑目标人的讲话时,VoCo要么从20分钟的音频样本当中找(如果有的话),要么通过原始的音素结合算法生成。

    VoCo很容易让人联想起 Adobe 公司在几个月前发布的一项PS技术:内容感知填充。这项技术也具备“无中生有”的超能力。这项技术一被提出,便引发了许多顾虑,人们担心这种无痕增删细节的技术会被不法分子所利用。因此,在对待VoCo的态度上 Adobe 相当谨慎,虽说目前还只停留在技术原型阶段,Adobe 已经在考虑如何通过“水印和甄别”来防止欺诈。

    VoCo首次进入大众视野是在2016年的 Adobe Max 大会上。该公司通常会在将新技术商业化之前一两年向公众展示。倘若VoCo能够成功走出原型阶段,将很有可能作为 Adobe Audition 的组件之一。

    届时用户可以自由编辑播客和录音,更重要的是,还能够恶搞名人政客的音频发到新闻社交网站Reddit上。此外,用户还能够绕过目前银行所使用的语音识别技术。想想吧,使用黑科技对你的“宿敌”进行恶毒语音留言轰炸,而且这些语音(非常像那么回事的)还是出自他们至亲至爱之人之口,尽管实际上这只是你用家里的电脑捣鼓出来的……


相关阅读
图文推荐