Umi-OCR文字识别工具(离线OCR软件) v2.1.5 中文绿色版

Umi-OCR是一款免费,开源,可批量的离线OCR软件,适用于 Windows10,11 平台。可以批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。

Umi-OCR文字识别工具(离线OCR软件) v2.1.5 中文绿色版

软件特点

免费:本项目所有代码开源,完全免费。 方便:解压即用,离线运行,无需网络。 批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。 高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

更新日志

v2.1.5 主要更新: 新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。 新增:大部分标签页能手动切换左右/上下双栏模式。 (#789) 新增:Esc键隐藏主窗口。 (#652) 新增:调整二维码生成相关参数后,自动刷新二维码生成。 (#690) 新增:命令行指令 –reload ,用于重新加载配置文件。 👉 文档 修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。 (#785) 修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。 修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。 修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。 修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。 修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。 (#778) 修复:Linux版本截图后,主窗口的位置与操作前不一致。 优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。 (#710) Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0 新增UI语言:俄语 Português ,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்。

下载说明

以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。 附带 简中/繁中/英/日/韩/俄 多国语言识别库。 Paddle 引擎插件版 (性能好,速度快,占用率高,适合高配机器) Rapid 引擎插件版 (速度稍慢,内存占用低,兼容好,适合低配机器)

下载地址


Umi-OCR文字识别工具(离线OCR软件) v2.1.5 中文绿色版

https://pan.quark.cn/s/0254518f915b

https://pan.xunlei.com/s/VOMF6W3WSIwwHxHC5KZzdXvKA1?pwd=i8ze#

本博客已稳定运行