趣丸科技聯(lián)合港中大(深圳)開源首個語音大模型,效果全球領(lǐng)先躋身第一梯隊
10月24日,趣丸科技宣布與香港中文大學(xué)(深圳)聯(lián)合研發(fā)的語音大模型“MaskGCT”正式開源,面向全球用戶開放使用。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模型與語音表征解耦編碼的創(chuàng)新范式,在聲音克隆、跨語種合成、語音控制等任務(wù)中展現(xiàn)出卓越效果。
據(jù)介紹,MaskGCT在三個TTS基準(zhǔn)數(shù)據(jù)集上都達(dá)到了SOTA效果,超過當(dāng)前最先進(jìn)的同類模型,某些指標(biāo)甚至超過人類水平。顯著特點如下:
1、秒級超逼真的聲音克隆:提供3秒音頻樣本即可復(fù)刻人類、動漫、“耳邊細(xì)語”等任意音色,且能完整復(fù)刻語調(diào)、風(fēng)格和情感。
2、更精細(xì)可控的語音生成:可靈活調(diào)整生成語音的長度、語速和情緒,支持通過編輯文本編輯語音,并保持韻律、音色等方面的極度一致。
3、高質(zhì)量多語種語音數(shù)據(jù)集:訓(xùn)練于香港中文大學(xué)(深圳)和趣丸科技等機(jī)構(gòu)聯(lián)合推出的10萬小時數(shù)據(jù)集Emilia,是全球最大且最為多樣的高質(zhì)量多語種語音數(shù)據(jù)集之一,精通中英日韓法德6種語言的跨語種合成。
據(jù)介紹,MaskGCT(Masked Generative Codec Transformer)是一個大規(guī)模的零樣本TTS模型,采用非自回歸掩碼生成Transformer,無需文本與語音的對齊監(jiān)督和音素級持續(xù)時間預(yù)測。其技術(shù)突破性在于采用掩碼生成模型與語音表征解耦編碼的創(chuàng)新范式。實驗表明,MaskGCT在語音質(zhì)量、相似度和可理解性方面優(yōu)于當(dāng)前最先進(jìn)的TTS模型,并且在模型規(guī)模和訓(xùn)練數(shù)據(jù)量增加時表現(xiàn)更佳,同時能夠控制生成語音的總時長。MaskGCT已在香港中文大學(xué)(深圳)與上海人工智能實驗室聯(lián)合開發(fā)的開源系統(tǒng)Amphion發(fā)布。
該模型研發(fā)團(tuán)隊在語音領(lǐng)域擁有深厚的研究積累和原創(chuàng)性成果。這主要依托趣丸科技十年深耕音頻技術(shù)領(lǐng)域和億級高質(zhì)量語音用戶的服務(wù)經(jīng)驗,以及香港中文大學(xué)(深圳)國際一流水平的師資隊伍。早在今年5月份,趣丸科技就與香港中文大學(xué)(深圳)宣布共建聯(lián)合實驗室,針對人工智能音頻大模型相關(guān)的前沿課題進(jìn)行研究,旨在突破行業(yè)難題,促進(jìn)產(chǎn)學(xué)研深度融合,打造技術(shù)領(lǐng)先的生成式音頻大模型,填補(bǔ)業(yè)界空白。
目前,MaskGCT在短劇出海、數(shù)字人、智能助手、有聲讀物、輔助教育等領(lǐng)域擁有豐富的應(yīng)用場景。為了加快落地應(yīng)用,在安全合規(guī)下,趣丸科技打造了多語種速譯智能視聽平臺“趣丸千音”。一鍵上傳視頻即可快速翻譯成多語種版本,并實現(xiàn)字幕修復(fù)與翻譯、語音翻譯、唇音同步等功能。該產(chǎn)品進(jìn)一步革新視頻翻譯制作流程,大幅降低過往昂貴的人工翻譯成本和冗長的制作周期,成為影視、游戲、短劇等內(nèi)容出海的理想選擇平臺。
隨便看看:
相關(guān)推薦:
網(wǎng)友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件
- 天然鉆石婚戒銷售額逆勢增7%,3500美元全球客單
- 巨星傳奇再展創(chuàng)新實力,“愛吃鮮摩人”虎堅果蛋白粉國
- 余承東重磅宣布:3億華為老用戶將陸續(xù)升級鴻蒙5.0
- 東北外賣小哥與美國幼師的浪漫奇緣:五個月閃婚見證真
- 共創(chuàng)、共鏈、共贏——2025穩(wěn)健集團(tuán)創(chuàng)新發(fā)展研討會
- “躬行踐履結(jié)碩果,星火相傳向未來” ——2025年
- 告別炎夏里的冷凝水煩惱 萬和熱水器以霧化外排技術(shù)為
- 京東健康與衛(wèi)材中國達(dá)成戰(zhàn)略合作 獨家首發(fā)原研新藥萊
- “2025探索東盟優(yōu)勢”論壇 —— 聚焦泰國,啟航
- 經(jīng)濟(jì)學(xué)者李長亮說內(nèi)容電商突破內(nèi)容瓶頸開啟發(fā)展新章
- 選嬰兒推車的三大步驟,靠譜的避震嬰兒車這樣判斷
- 唯一乳企!蒙牛集團(tuán)再獲國家科學(xué)技術(shù)獎二等獎
- 上海梅林正式更名為光明肉業(yè) 以新名稱迎接行業(yè)挑戰(zhàn)
- 南方網(wǎng)通第二十五屆渠道商大會暨樹品5.0發(fā)布會圓滿
- 菲律賓圣保羅大學(xué)(土格加勞總校)再傳喜訊!2024
- 新公司法下要不要減資?這些風(fēng)險要考慮!
- 抖音開放平臺助力村超推廣,潑天流量帶來經(jīng)濟(jì)發(fā)展新路
- 南美一姐:秘魯商務(wù)考察全攻略,外貿(mào)公司和工廠必讀指
- 減重別只會吃雞胸肉,綠瘦告訴你還有哪些肉類更值得吃
- 事業(yè)家庭雙豐收的幸福人生--莎蔓莉莎員工劉興