Mocking Bird 是一款開源的 AI 擬聲項(xiàng)目,由 @babysor 開發(fā)。該項(xiàng)目在 GitHub 上已獲得 32K 的 Star,具有以下功能特性:
1. 支持中文普通話擬聲,并在多個中文數(shù)據(jù)集上進(jìn)行了測試。
2. 可在 Windows、Linux、Mac 操作系統(tǒng)上使用。
3. 基于 B / S 架構(gòu)交互,簡單收集聲音并生成擬聲。
4. 提供詳細(xì)的部署教程、訓(xùn)練教程和使用教程。
部署教程
如何部署在該項(xiàng)目的 Readme 寫的很詳細(xì),相對比較簡單,按說明把 Python 環(huán)境、PyTorch、多媒體處理組件 FFmpeg 裝好,剩下的就用把依賴庫都裝了,就差不多完成了。部署成功后,可以在瀏覽器訪問 8080 端口來體驗(yàn) Mocking Bird。首先輸入生成語音的中文話術(shù),然后錄制一段你的聲音,使用 synthesizer 或者其它模型進(jìn)行訓(xùn)練一下,就能合成一段語音了。簡單的這幾步,你會發(fā)現(xiàn)離以假亂真的效果還有距離。這時候就要運(yùn)行開發(fā)者提供的 demo_toolbox.py 工具箱,進(jìn)行調(diào)參以達(dá)到滿意的效果。
項(xiàng)目地址
正文完
2024-02-02