相關閱讀:
計畫介紹
EasyOCR 是一個強大且多功能的光學字元辨識工具,專為需要從影像中提取文本的開發者設計。它支持超過80種語言和書寫體系,包括拉丁文、中文、阿拉伯文、天城文、西里耳文等。這種全面的語言覆蓋使其適用於廣泛的場景,從文件掃描到標誌轉譯。
路牌精準辨識
特點
EasyOCR 是一款支持本地或雲端部署、具備高精度辨識能力、高度可客製且能處理復雜版式與非文本元素的先進OCR工具,配備半自動標註工具以簡化數據準備流程。
本地部署或雲API :EasyOCR 可以在本地伺服器上部署,也可以透過雲API服務使用,提供靈活的選擇以滿足特定需求。
高精度 :能夠根據使用者的數據將準確度提升至99%以上,確保文本提取的可靠性。
高度可客製 :完全可客製化,支持80多種語言,並允許使用者用自己的數據訓練模型。
版式辨識 :EasyOCR 能夠辨識復雜的版式結構,如表格和表單。
條碼與二維碼提取 :可以提取影像中的簽名、二維碼和條形碼。
半自動標註工具 :簡化了數據集的標註過程,提高效率並減少人工勞動。
開源成就
目前已經取得23.1K Star
主要功能
EasyOCR 的核心功能包括:
支持多種語言和書寫體系的文本辨識。
布局分析,用於理解並從結構化的文件中提取文本,例如表格和表單。
提取額外元素,如條形碼、二維碼和簽名。
安裝指南
為了安裝 EasyOCR,請使用
pip
獲取最新穩定版本:
pip install easyocr
對於最新的開發版本,使用:
pip install git+https://github.com/JaidedAI/EasyOCR.git
在 Windows 系統上,需先根據官方 PyTorch 指南安裝
torch
和
torchvision
。如果僅使用 CPU 執行,則在安裝時選擇 CUDA=None。
使用範例
首先,匯入庫並初始化
Reader
類,指定所需的語言,這裏我們用中文
import easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('路牌.png')
for res in result:
print(res)
辨識結果
No. | Text | Confident Score |
---|---|---|
0 | 西 | 0.3276 |
1 | 鳳台路 | 0.7183 |
2 | 末來路 | 0.4655 |
3 | [89 | 0.0066 |
4 | 7。; | 0.0002 |
5 | 尺4 | 0.0218 |
6 | 鳳凰東路 | 0.8949 |
7 | 鳳鳴路 | 0.9243 |
8 | 「89 | 0.0139 |
9 | 怊49 | 0.0002 |
10 | 舊) | 0.028 |
11 | 尉 | 0.0019 |
12 | 「89 | 0.0133 |
13 | 英協路 | 0.7195 |
14 | 川9 | 0.0016 |
15 | 尺4 | 0.0587 |
16 | 貨站街 | 0.9771 |
17 | 金水路 | 0.9369 |
18 | 勺;^ :^ | 0.0468 |
圖片辨識標註
命令列執行
透過命令列執行 OCR,命令如下:
easyocr -l ch_sim en -f chinese.jpg --detail=1 --gpu=True
此命令將在影像
chinese.jpg
上進行 OCR 處理,使用中文和英文作為目標語言,並顯示詳細輸出,利用 GPU 加速。
EasyOCR 為希望在其應用程式中整合 OCR 功能的開發者提供了強大的解決方案,具有廣泛的語言支持、高精度以及可客製性。
近期熱文: