Chenyme AAVT 是一個功能強(qiáng)大、使用簡單的全自動視頻 / 音頻翻譯工具。它可以快速識別聲音并翻譯生成字幕文件, 然后將翻譯后的字幕與原視頻合并, 生成翻譯后的視頻。該項目主要基于 OpenAI 的 Whisper 進(jìn)行聲音識別, 支持多種語言, 并利用 LLMs 如 ChatGPT、KIMI、DeepSeek 等進(jìn)行字幕翻譯, 或使用本地大語言模型進(jìn)行翻譯。它還支持 GPU 加速和 VAD 輔助, 提高了識別和翻譯的效率。此外, 該工具支持輸出多種字幕格式, 并提供字幕修改和預(yù)覽功能, 同時還支持對音頻直接進(jìn)行 AI 總結(jié)和問答。項目使用 Streamlit 搭建了一個快速使用的 WebUI 界面, 并利用 FFmpeg 實(shí)現(xiàn)了字幕與視頻的合并??偟膩碚f, 這是一個功能強(qiáng)大、使用簡單的全自動視頻 / 音頻翻譯工具, 值得廣大用戶嘗試使用。
正文完