F5-TTS：上海交大開源超逼真聲音克隆 TTS

79次閱讀

沒有評論

一款基于流匹配的全非自回歸文本到語音轉換系統(tǒng)，零樣本，支持聲音克隆、速度控制、控制語音情感表現(xiàn)、長文本合成、中英文多語言合成，并支持商用。

不需要復雜的設計如持續(xù)時間模型、文本編碼器和音素對齊，能夠快速訓練并實現(xiàn)實時因素（RTF）0.15 的推理速度，顯著優(yōu)于當前基于擴散的 TTS 模型。

F5-TTS 在公共的 100K 小時多語言數(shù)據(jù)集上進行訓練，展現(xiàn)出高自然性和表現(xiàn)力的零樣本能力、無縫代碼切換能力和速度控制效率。

開源地址：https://github.com/SWivid/F5-TTS

正文完

F5-TTS

發(fā)表至：值得一看開源項目

2024-10-16

0

轉載說明：本站提供的一切軟件、教程、電子書、視頻、圖片、音樂、文字以及所有內容信息僅供個人學習、研究或欣賞；不得將上述內容用于商業(yè)或者非法用途，否則，一切后果請用戶自負。本站信息來自網友分享及網絡收集整理，版權爭議與本站無關。您必須在下載后的24個小時之內，從您的電腦或手機中徹底刪除上述內容。如果您喜歡相關內容信息，請支持正版，進行購買注冊，以得到更好的正版服務。我們非常重視版權問題，如有侵權請郵件與我們聯(lián)系處理。敬請諒解！侵刪請致信E-mail：tntwl@qq.com

粵音資料集叢：一個粵語讀音查詢網站

Wallos：一個開源的個人訂閱服務跟蹤工具

Latent Box：AI 創(chuàng)意和藝術領域的開源精選合集

動手學深度學習第二版在線教科書

Remove Background：在線AI圖片背景去除工具

在線制作舉牌照：美女舉牌照、大學生舉牌照一鍵生成

GitHub特定文件夾或文件在線下載工具

速寫板：一個在線繪畫的畫板網站

磁力樂v1.01磁力邊下邊播