一個(gè)可以批量為視頻文件生成字幕文件,并翻譯成其它語(yǔ)言的小工具。
原理是通過(guò) ffmpeg 從視頻文件中提取出音頻文件,再通過(guò) whisper 模型將音頻生成原語(yǔ)言的字幕文件,然后調(diào)用翻譯 API,將原語(yǔ)言的字幕文件翻譯成目標(biāo)語(yǔ)言的字幕文件。
▎項(xiàng)目特點(diǎn):
?源語(yǔ)言字幕文件和目標(biāo)語(yǔ)言字幕文件放在視頻同目錄下,方便播放時(shí)任意掛載字幕文件
?批量處理目錄下面的所有視頻文件
?支持火山、百度、deeplx 翻譯
?自定義字幕文件名,方便兼容不同的播放器掛載字幕識(shí)別
?自定義翻譯后的字幕文件內(nèi)容,純翻譯結(jié)果,原字幕 + 翻譯結(jié)果
?項(xiàng)目集成 whisper.cpp,對(duì) apple silicon 進(jìn)行了優(yōu)化,有較快的生成速度
?項(xiàng)目集成了 fluent-ffmpeg,無(wú)須安裝 ffmpeg
正文完
2024-05-12