軟件介紹
最近接到一個(gè)需求,需要把錄音轉(zhuǎn)換為文字,一看網(wǎng)上幾款常用的工具,想不到都是收費(fèi)的;找了找,發(fā)現(xiàn)基本上都需要云端 api,僅有的幾個(gè)本地的都需要使用 GPU 中的 cuda 計(jì)算。因此,開發(fā)了這么一款語言轉(zhuǎn)文字的小工具,基于 Faster Whisper 模型,在 cpu 上也能達(dá)到不錯(cuò)的效果。
軟件截圖
使用方法
雙擊文件打開,在左上角選擇模型,左下角選擇推理方式與精度(cpu 推薦 int8,速度更快)。
若沒有支持 cuda 的 GPU 請(qǐng)不要選擇 GPU,否則會(huì)崩潰(原本想導(dǎo)入 pytorch 庫判斷 cuda_is_available 的,但是這樣打出來的包會(huì)把一整個(gè) pytorch 一起打包進(jìn)去,太大了,后來就沒這么處理)
首次使用需要下載模型,進(jìn)度在 console 中可見,請(qǐng)耐心等待。
文件名稱:whisper0.2.exe
文件大?。?52.94MB
下載聲明:本站全部資源來自于網(wǎng)友分享及網(wǎng)絡(luò)收集整理,若侵犯了您的隱私或版權(quán),請(qǐng)及時(shí)聯(lián)系我們刪除有關(guān)信息。
下載地址:
123 云盤:https://www.123pan.cn/s/kRr6jv-rhRid
百度網(wǎng)盤:https://pan.baidu.com/s/1MLcFLjl9FJkmDGhVuQrqYw?pwd=zhrd
小飛機(jī)網(wǎng)盤:https://share.feijipan.com/s/F5CG9fI7
正文完