當前位置: 妍妍網 > 碼農

23.1K Star這OCR太強!!!支持83種語言辨識

2024-08-09碼農


相關閱讀:



計畫介紹

EasyOCR 是一個強大且多功能的光學字元辨識工具,專為需要從影像中提取文本的開發者設計。它支持超過80種語言和書寫體系,包括拉丁文、中文、阿拉伯文、天城文、西里耳文等。這種全面的語言覆蓋使其適用於廣泛的場景,從文件掃描到標誌轉譯。

路牌精準辨識

特點

EasyOCR 是一款支持本地或雲端部署、具備高精度辨識能力、高度可客製且能處理復雜版式與非文本元素的先進OCR工具,配備半自動標註工具以簡化數據準備流程。

  • 本地部署或雲API :EasyOCR 可以在本地伺服器上部署,也可以透過雲API服務使用,提供靈活的選擇以滿足特定需求。

  • 高精度 :能夠根據使用者的數據將準確度提升至99%以上,確保文本提取的可靠性。

  • 高度可客製 :完全可客製化,支持80多種語言,並允許使用者用自己的數據訓練模型。

  • 版式辨識 :EasyOCR 能夠辨識復雜的版式結構,如表格和表單。

  • 條碼與二維碼提取 :可以提取影像中的簽名、二維碼和條形碼。

  • 半自動標註工具 :簡化了數據集的標註過程,提高效率並減少人工勞動。

  • 開源成就

    目前已經取得23.1K Star

    主要功能

    EasyOCR 的核心功能包括:

  • 支持多種語言和書寫體系的文本辨識。

  • 布局分析,用於理解並從結構化的文件中提取文本,例如表格和表單。

  • 提取額外元素,如條形碼、二維碼和簽名。

  • 安裝指南

    為了安裝 EasyOCR,請使用 pip 獲取最新穩定版本:

    pip install easyocr

    對於最新的開發版本,使用:

    pip install git+https://github.com/JaidedAI/EasyOCR.git

    在 Windows 系統上,需先根據官方 PyTorch 指南安裝 torch torchvision 。如果僅使用 CPU 執行,則在安裝時選擇 CUDA=None。

    使用範例

    首先,匯入庫並初始化 Reader 類,指定所需的語言,這裏我們用中文

    import easyocr
    reader = easyocr.Reader(['ch_sim','en'])
    result = reader.readtext('路牌.png')
    for res in result:
    print(res)

    辨識結果

    No. Text Confident Score
    0 西 0.3276
    1 鳳台路 0.7183
    2 末來路 0.4655
    3 [89 0.0066
    4 7。; 0.0002
    5 尺4 0.0218
    6 鳳凰東路 0.8949
    7 鳳鳴路 0.9243
    8 「89 0.0139
    9 怊49 0.0002
    10 舊) 0.028
    11 0.0019
    12 「89 0.0133
    13 英協路 0.7195
    14 川9 0.0016
    15 尺4 0.0587
    16 貨站街 0.9771
    17 金水路 0.9369
    18 勺;^ :^ 0.0468

    圖片辨識標註

    命令列執行

    透過命令列執行 OCR,命令如下:

    easyocr -l ch_sim en -f chinese.jpg --detail=1 --gpu=True

    此命令將在影像 chinese.jpg 上進行 OCR 處理,使用中文和英文作為目標語言,並顯示詳細輸出,利用 GPU 加速。

    EasyOCR 為希望在其應用程式中整合 OCR 功能的開發者提供了強大的解決方案,具有廣泛的語言支持、高精度以及可客製性。

    近期熱文: