当前位置: 欣欣网 > 码农

23.1K Star这OCR太强!!!支持83种语言识别

2024-08-09码农


相关阅读:



项目介绍

EasyOCR 是一个强大且多功能的光学字符识别工具,专为需要从图像中提取文本的开发者设计。它支持超过80种语言和书写体系,包括拉丁文、中文、阿拉伯文、天城文、西里尔文等。这种全面的语言覆盖使其适用于广泛的场景,从文档扫描到标志翻译。

路牌精准识别

特点

EasyOCR 是一款支持本地或云端部署、具备高精度识别能力、高度可定制且能处理复杂版式与非文本元素的先进OCR工具,配备半自动标注工具以简化数据准备流程。

  • 本地部署或云API :EasyOCR 可以在本地服务器上部署,也可以通过云API服务使用,提供灵活的选择以满足特定需求。

  • 高精度 :能够根据用户的数据将准确度提升至99%以上,确保文本提取的可靠性。

  • 高度可定制 :完全可定制化,支持80多种语言,并允许用户用自己的数据训练模型。

  • 版式识别 :EasyOCR 能够识别复杂的版式结构,如表格和表单。

  • 条码与二维码提取 :可以提取图像中的签名、二维码和条形码。

  • 半自动标注工具 :简化了数据集的标注过程,提高效率并减少人工劳动。

  • 开源成就

    目前已经取得23.1K Star

    主要功能

    EasyOCR 的核心功能包括:

  • 支持多种语言和书写体系的文本识别。

  • 布局分析,用于理解并从结构化的文档中提取文本,例如表格和表单。

  • 提取额外元素,如条形码、二维码和签名。

  • 安装指南

    为了安装 EasyOCR,请使用 pip 获取最新稳定版本:

    pip install easyocr

    对于最新的开发版本,使用:

    pip install git+https://github.com/JaidedAI/EasyOCR.git

    在 Windows 系统上,需先根据官方 PyTorch 指南安装 torch torchvision 。如果仅使用 CPU 运行,则在安装时选择 CUDA=None。

    使用示例

    首先,导入库并初始化 Reader 类,指定所需的语言,这里我们用中文

    import easyocr
    reader = easyocr.Reader(['ch_sim','en'])
    result = reader.readtext('路牌.png')
    for res in result:
    print(res)

    识别结果

    No. Text Confident Score
    0 西 0.3276
    1 凤台路 0.7183
    2 末来路 0.4655
    3 [89 0.0066
    4 7。; 0.0002
    5 尺4 0.0218
    6 凤凰东路 0.8949
    7 凤鸣路 0.9243
    8 「89 0.0139
    9 怊49 0.0002
    10 旧) 0.028
    11 0.0019
    12 「89 0.0133
    13 英协路 0.7195
    14 川9 0.0016
    15 尺4 0.0587
    16 货站街 0.9771
    17 金水路 0.9369
    18 勺;^ :^ 0.0468

    图片识别标注

    命令行运行

    通过命令行执行 OCR,命令如下:

    easyocr -l ch_sim en -f chinese.jpg --detail=1 --gpu=True

    此命令将在图像 chinese.jpg 上进行 OCR 处理,使用中文和英文作为目标语言,并显示详细输出,利用 GPU 加速。

    EasyOCR 为希望在其应用程序中集成 OCR 功能的开发者提供了强大的解决方案,具有广泛的语言支持、高精度以及可定制性。

    近期热文: