亚马逊Alexa又有新技能!新一代AI语音技术实现主播声音帮_M真生活_新宝5登录霸_金城线上娱乐下载
首页 N小生活 I地生活 G迈生活 M真生活
 主页 > M真生活 >亚马逊Alexa又有新技能!新一代AI语音技术实现主播声音帮 >

亚马逊Alexa又有新技能!新一代AI语音技术实现主播声音帮

2020-06-16  |  来源:http://www.vns1350.com  
 
亚马逊Alexa又有新技能!新一代AI语音技术实现主播声音帮

先前亚马逊自家智慧语音助理 Alexa 开发出新的 耳语模式 ,让用户深夜能轻声细语和 Alexa 交谈给予指令,透过神经网路的训练突破语音助理在低频低能量下的感应能力。近日,Alexa 的新技能是实现主播的播报声音。

新一代 AI 语音技术 超拟真背后真相?

随着越来越多功能被实现,语音助理正朝向更人性化的面向发展,去年 10 月,Google Assistant 利用 DeepMind「WaveNet」技术 ,透过分析原始声波并用类神经网路修正,实现更人性化的助理。

而这次 Alexa 背后使用的技术称为「神经文字转语音」技术,亚马逊表示新的语音风格是由自家开发的「神经文字转语音」技术简称 NTTS,透过机器学习更快地产生更加生动的声音,是新一代的语音合成方法。

至于主播说话的声音来自于现实生活中新闻频道的录音音频片段,藉由机器学习技术辨识并模仿,使机器可以像主播一样读新闻,更惊人的是 Alexa 竟然只花了几个小时来训练 Alexa 的新闻主播的声音。

亚马逊的 AI 语音负责人 Trevor Wood 表示,这种方法更容易捕捉真人讲话时的细节。虽然这其中微小的差异很难用语言描述,但很显然使用 AI 技术,透过数据驱动,可以比人更有效捕捉和模拟这些声音细节。

以下是过去语音合成技术到 NTTS 技术以及真人主播的声音,很显然新技术所呈现出来的语句更自然,抑扬顿挫也更为明显,让整体语音效果贴近真人主播。

过去语音合成技术:

Alexa 新的 NTTS 技术:

真人主播:

语音合成的突破

过去 Alexa 所使用的语音到底是怎麽产生的呢?事实上,Alexa 目前所使用的拼接语音合成技术已经使用数十年。背后是将语音样本分解成不同的声音,也就是音素,然后再将音素拼凑在一起以形成新的单字和句子。

虽然根据 路透社先前针对语音助理所做的报告 中说明用户习惯使用语音助理仍在主动性的功能像是搜寻、和启动设备,播报新闻场景在当今使用场景中所佔还是少数,Alexa 实现主播的声音在短时间内对用户来说可能不会有太明显的感受,但是在 AI 应用上仍是一项崭新的尝试,说不準未来亚马逊还会开发出更多系列的人声风格。

上一篇:
下一篇:
栏目最新
推荐资讯
未来城市﹕制度不公 穷人点向上流?
未来城市﹕制度不公 穷人点向上流?
未来城市﹕循环线游港九 海上交通复兴有望?
未来城市﹕循环线游港九 海上交通复兴有望?
双门、三门、四门 BMW热门车系大整理
双门、三门、四门 BMW热门车系大整理
双门之王 Rolls
双门之王 Rolls
曼谷美食 杀入新 FOOD COURT
曼谷美食 杀入新 FOOD COURT
曼谷自助必吃Savoey Seafood:这家咖哩螃蟹老字号
曼谷自助必吃Savoey Seafood:这家咖哩螃蟹老字号
栏目热门
 
爱乐C绿生活|本地综合信息服务|关注生活健康|网站地图 ladbrokes在线体育投注_正规炸金花斗牛平台 爱博体育登录网址_竞博体育登录 best365体育app_恒耀注册平台 信和在线开户官网_九龙娱乐总代 壹定发客户端_澳门新葡亰0066 bbin苹果手机客户端_正版魔方娱乐app 葡京娱乐手机h入口_凯撒娱乐苹果下载安装 18luck体育_dmg8888大满贯onm sunbet亚洲网址_万博体育app世界杯版 多宝平台总代_sunbet心水博