【AI無極限】用Bill Gates的聲音同你講話?Facebook新系統仿聲效果直逼真人
人工智能發展無界限!常使用衛星導航、翻譯軟體、手機語音等功能的你,是否常常覺得系統發出的聲音太機械化而感到不真實?根據報導指出,社群媒體巨頭Facebook(美股代號:FB)研發出一種能夠複製人類聲音與語調,從而發出更逼近真人聲音的語音系統。研究人員更在過程中使用Microsoft(美股代號:MSFT)創辦人Bill Gates的聲音進行測試,結果發現系統已能夠順利製造出與Bill Gates聲音相似度極高的語音,效果非常逼真。
Photo from Licensing
根據研究人員的說法,當文本透過系統轉換成語音的時候,通常會因各種限制而導致播出的聲音片段過於生硬,跟真人的語調比起來有巨大差別,因為人們在聽語音系統發出的說話聲時就會覺得過於機械化。此次Facebook研發人員最新研發出的系統名為MelNet,據悉此系統克服了語音系統的缺點,能夠準確模仿人類的語調,能夠製造出神似真人說出的話語。
Photo from Licensing
據了解,此系統透過偵測聲音出現的所有細微變化,並且在短時間內複製與捕捉音頻中的各種資訊,包括聲音來源的情緒變化,進而完整複製真人的語調。研究人員在研發過程中使用了TED演講的聲音片段來訓練該系統,其中也包括Bill Gates的演說片段。
Photo from 「Bill Gates」官方FB
研究人員成功讓MelNet高度「模仿」Bill Gates的聲音,並使用他的聲音說出一些簡單的話語。據說相似度極高,研究人員甚至表示難以辨認真人與系統的聲音,代表Facebook的AI系統發展又往前了一大步。即使此系統未來或為科技產業帶來許多便利,但也有媒體表示此系統也涉及許多理論問題,發展未來有待觀察。
Photo from Licensing
全球使用人數約20億的Facebook為了應付龐大的數據資料,近年也來積極專研軟硬體開發。除了上述AI系統,Facebook早前也宣布將開發自家AI晶片,希望能夠透過AI晶片有效提高Facebook平台的運作。Facebook AI科學家Yann LeCun也曾表示,除了上述提及的頂尖科技以外,Facebook未來計畫會推出能夠具備一定程度的學問知識,甚至與人類對話的AI智能助理。
Text by BusinessFocus Editorial