一個(gè)基于 OpenAI Whisper Large v3 (https://huggingface.co/openai/whisper-large-v3) 模型的高速音頻轉(zhuǎn)文字工具,能夠在不到 98 秒的時(shí)間內(nèi)轉(zhuǎn)錄 300 分鐘(5 小時(shí))音頻。
適用于多場景,支持 100 種語言的轉(zhuǎn)錄并支持翻譯功能,提供按詞或片段生成時(shí)間戳文本,方便字幕制作。
提供命令列界面(CLI),也可以通過 Whisper API 進(jìn)行線上語音轉(zhuǎn)文字。
正文完
2024-04-09