AI影片令假Taylor Swift說普通話 内地初創公司爆紅 以假亂真7個月收入百萬美元
AI以假亂真的技術已到了爐火純青的地步。不久前,一段看似是美國樂壇天后Taylor Swift說一口流利普通話的影片在内地社交媒體上瘋傳。網民找出影片背後的AI工具,發現竟然是由内地一個初創團隊所研發,疑是用AI生成語音及改嘴型,成功創造出懂說普通話的假Taylor Swift。據悉,這家公司創立不到1年,就實現了百萬美元的年收入,近幾個月以來的網站訪問量更上升92%,是繼前陣子爆紅的秒鴨相機後,再度於内網引發熱議的AIGC應用公司。
根據網傳的影片可見,相信是用AI「創造」的Taylor Swift在内的歐美名人,全都操著一口流利的普通話,仔細觀察嘴型也看不出破綻。隨著影片熱度越來越高,更多網民開始嘗試製作類似影片,最後發現一款名為HeyGen的AI生成影片工具,可一鍵式完成翻譯、聲音克隆、音頻生成及更改嘴型等步驟,生成一條讓片中人物說外語的影片。
内媒《36氪》報道,這款名叫HeyGen的軟件可免費試用,但只能生成時長1分鐘的影片,且等待時間較長。若想製作長影片,則需訂閲最低價格為每月24美元(約187港元)的付費版。相比逐個使用語音轉文字Whisper、文字翻譯ChatGPT、聲音克隆及生成音頻so-vits-svc及生成符合音頻的嘴型影片GeneFace++等開源工具製作類似影片,HeyGen大大減少了作業時間與精力,對有需求的用戶來説,是個十分方便的AI工具。
Photo from HeyGen
此外,HeyGen支持50多種語言及300多種不同音色,用戶可上傳自己的照片進行個性化形象定制數字人,或使用網站提供的上百款數字人素材及模板。其生成影片基本保證1080P的分辨率,惟目前技術還不成熟,除人物情感還原度稍有欠缺以外,影片亦會出現抖動情況、AI生成人物眨眼頻率過高等問題。
Photo from HeyGen
報道指出,HeyGen背後的公司是於2020年12月創立的初創公司「詩雲科技」,於2022年7月推出由自家研發的多模態内容生成引擎「Surreal Engine」推動的HeyGen前身「Movio」,後隨即在歐美地區爆紅。HeyGen創辦人徐卓(Joshua Xu)曾任職於社交軟件公司Snap,並曾在HeyGen上線不到一年、於社交媒體X(前稱Twitter)上發文表示,HeyGen在7個月内實現了100萬美元(約780萬港元)的年度經常性收入(ARR),並保持了連續9個月50%的月環比增長率。
今年8月,徐卓更接著以自身形象的AI生成數字人,在X上公布HeyGen最新的AI模型,另類宣傳方式收穫300萬次瀏覽,成功讓網站訪問量翻倍。報道援引一位分析師的統計指出,當時内地各大文生圖類AI網站的訪問量均呈現下滑趨勢,唯有HeyGen的訪問量上升了92%,流量躍居國内各大獨立AI網站之首。
Photo from X
報道稱,HeyGen上線初期的願景就是讓客戶「以低成本完成AI内容生成創作」,如今其團隊人員達到30名,且分布全球各地,網站流量更在Taylor Swift等歐美名人「說普通話」的AI生成影片下爆紅,相信營收數據也會大幅增加。
據悉,HeyGen上周四推出了訂閲費為每月72美元(約562港元)的商業版本新功能,即可生成長達3小時的影片内容,畫質最高可提升至4K,可於新上線的並排脚本編輯器、繼承的校對模塊中進行。
Text by BusinessFocus Editorial