Umi-OCR 圖片轉(zhuǎn)文字是一款批量對本地圖片文件進行離線 OCR 文字識別工具。
軟件特點
支持生成內(nèi)聯(lián)圖片的 Markdown 文件
支持 win10 x64
能批量識別普通圖片,支持忽略指定區(qū)域功能
輸出到軟件面板或本地 txt 文件 /md 文件
無需聯(lián)網(wǎng)
可用于批量識別視頻截圖時排除右上角水印的干擾,批量識別游戲截圖時排除 UI 與按鈕的干擾,讓識別結(jié)果只留下所需的文本
注意事項
軟件是本地圖片文件處理工具,沒有實時屏幕截圖識別的功能
不建議使用 win7,核心 c ++ 模塊 PaddleOCR-json 基本無法運行
如果想嘗試,win7 x64 sp1 打滿系統(tǒng)升級補丁 + 安裝 vc 運行庫后有小概率能跑起來
打開忽略區(qū)域設置窗口,拖入任一張截圖,會顯示出圖片,識別到的文字區(qū)域會被虛線框起來。右上角的水印也會被識別到,點擊選擇 + 忽略區(qū)域 1,鼠標按住,繪制矩形完全包裹住水印區(qū)域,范圍可以大一些,點擊 完成。返回主窗口,開始任務即可。
軟件特點
免費:本項目所有代碼開源,完全免費。
方便:解壓即用,離線運行,無需網(wǎng)絡。
批量:可批量導入處理圖片,結(jié)果保存到本地 txt / md / jsonl 多種格式文件。也可以即時截屏識別。
高效:采用 PaddleOCR-json C++ 識別引擎。只要電腦性能足夠,通常比在線 OCR 服務更快。
精準:默認使用 PPOCR-v3 模型庫。除了能準確辨認常規(guī)文字,對手寫、方向不正、雜亂背景等情景也有不錯的識別率??稍O置忽略區(qū)域排除水印、設置文塊后處理合并排版段落,得到規(guī)整的文本。
更新日志
V2.1.2 主要更新
新增:批量任務(圖片、文檔)支持 暫停任務。只要不退出軟件,在待機 / 休眠后可以恢復任務。
新增:文檔任務支持保存為 單層純文本 PDF。
新增:HTTP OCR 接口 允許設置 忽略區(qū)域 參數(shù)。
新增:HTTP 二維碼接口 允許設置 圖像預處理 參數(shù)。
新增:命令行 –screenshot 允許 指定屏幕范圍,自動進行截圖。
修復:文檔內(nèi)容提取和寫入時的坐標旋轉(zhuǎn)、比例適配問題。
優(yōu)化:批量文檔標簽頁,拖入大量文件、提交大批任務時的性能和流暢度。
優(yōu)化:文檔任務保存的文件名規(guī)則。
UI:優(yōu)化一些布局,調(diào)整一些文本,美化一些視覺效果。
GitHub:https://github.com/hiroi-sora/Umi-OCR/releases/latest
123 云盤:https://www.123pan.com/s/WfWiVv-UbUv3.html
百度網(wǎng)盤:https://pan.baidu.com/s/1hxLe-UykYWN8VL51dGTdog?pwd=vj56
小飛機網(wǎng)盤:https://share.feijipan.com/s/5MBEJIv5