Umi-OCR：开源免费的OCR 文字识别工具，支持截图、PDF等多种输入

2024-02-29码农

项目简介

Umi-OCR是一款免费、开源的离线OCR软件，旨在为用户提供快速、高效的文本识别服务。它支持多种语言，能够处理图片、PDF文档，并具备批量识别功能。此外，软件还包括二维码的扫描和生成，以及对水印和页眉页脚的智能排除，适用于个人和企业用户。

扫码加入交流群

获得更多技术支持和交流

特点

· 免费：项目代码完全开源且免费使用。

· 易用：解压后直接使用，无需联网，支持离线操作。

· 效率：配备高效的离线OCR引擎，支持多语言文本识别。

· 灵活：提供多种使用方式，包括命令行和HTTP接口。

· 功能：集成了截图文本识别、批量处理、PDF文件识别、二维码处理及公式识别等功能。

开始使用

下载链接在文章最后

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上，解压文件。

本软件无需安装。解压后，点击 Umi-OCR.exe 即可启动程序。

界面语言

Umi-OCR支持多种界面语言，首次使用时会根据电脑系统设置自动选择语言。如需手动更改语言，可在软件的「全局设置」中找到「语言/Language」选项进行调整。

截图OCR

在Umi-OCR中，启用软件后可通过快捷键进行截图并识别图中文字。软件界面左侧为图片预览区，支持鼠标划选文本复制。右侧则为识别记录区，允许编辑和复制多个记录。此外，Umi-OCR还支持从其他应用复制图片后，直接粘贴到软件中进行文本识别。

在Umi-OCR的文本后处理中，用户可以选择不同的排版解析方案以优化OCR结果，使文本更易于阅读和应用。包括适应多栏或单栏布局的不同换行规则，如按自然段换行、总是换行、或无换行。特别的，还有针对代码截图的排版保留选项，以及保持OCR引擎原始输出的选择。这些设置旨在满足不同文本排版需求，同时支持横排和竖排文本的自动处理。

批量OCR