Umi-OCR：開源免費的OCR 文字辨識工具，支持截圖、PDF等多種輸入

2024-02-29碼農

計畫簡介

Umi-OCR是一款免費、開源的離線OCR軟體，旨在為使用者提供快速、高效的文本辨識服務。它支持多種語言，能夠處理圖片、PDF文件，並具備批次辨識功能。此外，軟體還包括二維碼的掃描和生成，以及對浮水印和頁首頁尾的智慧排除，適用於個人和企業使用者。

掃碼加入交流群

獲得更多技術支持和交流

特點

· 免費：計畫程式碼完全開源且免費使用。

· 易用：解壓後直接使用，無需聯網，支持離線操作。

· 效率：配備高效的離線OCR引擎，支持多語言文本辨識。

· 靈活：提供多種使用方式，包括命令列和HTTP介面。

· 功能：整合了截圖文本辨識、批次處理、PDF檔辨識、二維碼處理及公式辨識等功能。

開始使用

下載連結在文章最後

軟體釋出包下載為 .7z 壓縮包或 .7z.exe 自解壓包。自解壓包可在沒有安裝壓縮軟體的電腦上，解壓檔。

本軟體無需安裝。解壓後，點選 Umi-OCR.exe 即可啟動程式。

界面語言

Umi-OCR支持多種界面語言，首次使用時會根據電腦系統設定自動選擇語言。如需手動更改語言，可在軟體的「全域設定」中找到「語言/Language」選項進行調整。

截圖OCR

在Umi-OCR中，啟用軟體後可透過快捷鍵進行截圖並辨識圖中文字。軟體界面左側為圖片預覽區，支持滑鼠劃選文本復制。右側則為辨識記錄區，允許編輯和復制多個記錄。此外，Umi-OCR還支持從其他套用復制圖片後，直接貼上到軟體中進行文本辨識。

在Umi-OCR的文本後處理中，使用者可以選擇不同的排版解析方案以最佳化OCR結果，使文本更易於閱讀和套用。包括適應多欄或單欄布局的不同換行規則，如按自然段換行、總是換行、或無換行。特別的，還有針對程式碼截圖的排版保留選項，以及保持OCR引擎原始輸出的選擇。這些設定旨在滿足不同文本排版需求，同時支持橫排和豎排文本的自動處理。

批次OCR