一款開源的高質量文本轉語音工具,適用于 Windows 操作系統。它能夠轉換文本、PDF、EPUB 和 SRT 文件為多種語言的語音音頻。除了基本的文本轉語音功能,Pandrator 還支持語音克隆、LLM 基于文本的預處理以及直接將生成的字幕音頻保存到視頻文件的能力。它利用了 XTTS、Silero、VoiceCraft 等模型進行文本到語音轉換和語音克隆,并通過 RVC_CLI 進行增強,以提高語音質量和克隆結果。同時,Pandrator 還集成了 Text Generation Webui 的 API,可用于基于本地 LLM 的文本預處理,為音頻生成前提供廣泛的文本操作。
正文完