clone voice?是一個開源項目,以下引用官方介紹:
這是一個聲音克隆工具,可使用任何人類音色,將一段文字合成為使用該音色說話的聲音,
或者將一個聲音使用該音色轉(zhuǎn)換為另一個聲音。
使用非常簡單,沒有 N 卡 GPU 也可以使用,
下載預(yù)編譯版本,雙擊 app.exe 打開一個 web 界面,鼠標(biāo)點(diǎn)點(diǎn)就能用。
支持 中、英、日、韓、法、德、意等 16 種語言,可在線從麥克風(fēng)錄制聲音。
為保證合成效果,建議錄制時長 5 秒到 20 秒,發(fā)音清晰準(zhǔn)確,不要存在背景噪聲。
英文效果很棒,中文效果還湊合。
下載主程序,解壓,下載模型,解壓后放到主程序下的 tts 文件夾中,雙擊 app.exe 啟動程序,
可能要等待幾分鐘才能啟動成功,下面鏈接里我已經(jīng)把作者的說明文檔搬了過來,具體看文檔,
成功啟動后,會自動在瀏覽器中打開 http://127.0.0.1:9988;
重要說明:
1、模型來自于?https://github.com/coqui-ai/TTS,因此中文效果可能一般般;
2、這程序的一些錯誤可能都是因為網(wǎng)絡(luò)問題產(chǎn)生的,例如聲音線程啟動失敗,
具體看下面鏈接里的說明文檔;
主程序與模型與說明文檔:https://www.123pan.com/s/kc1zVv-dA73A.html
下面是項目作者提供的鏈接:
主程序:https://pan.baidu.com/s/1YliZiPMXtSFSHI9vk9uajQ?pwd=racj
正文完