Releases: hiroi-sora/Umi-OCR_v2
Umi-OCR v2.0.0
请前往主仓库,查看和下载 v2.0.0 正式版:
预览版 dev 20231114
V2开发计划中的预期功能已全部到位,准备在本月中下旬发布v2.0.0正式版。
关于大家关心的两个大型新功能:PDF识别、截图翻译,将在v2.1等后续版本中逐步更新。
个人业余时间开发,产能有限,请多包涵~~
协助翻译!
👉 参考文档 👈
Umi-OCR 的UI界面支持多国语言。邀请各路大佬参与翻译工作!以下是现有语言列表。
(如果你希望新增一个不在列表中的语言,需要稍微改动源码。可参考文档自己尝试,或者提个issue让我弄。)
已校对 | 未翻译 | ||
---|---|---|---|
zh_TW |
繁體中文 | es_ES |
Español |
en_US |
English | fr_FR |
Français |
de_DE |
Deutsch | ||
ko_KR |
한국어 | ||
未校对 | ru_RU |
Русский | |
ja_JP |
日本語 | pt_BR |
Português |
it_IT |
Italiano |
关于配置文件迁移
升级Umi-OCR时,如需保留旧版本配置,只需要将旧版本的以下文件放到新软件相同位置即可:
UmiOCR-data/.settings
更新日志 v2.0.0 dev 20231114
- 新增:生成二维码功能。
- 新增:所有图片预览窗口(如截图、二维码页),允许保存图片到指定路径。
- 优化:二维码解析库改用性能更好、功能更丰富的zxingcpp。 (#47) (感谢:@Byxs20)
- 优化:截图预览面板中,文本框的位置更准确。
- 修复:图片预览窗口,无法复制本地图片的Bug。
- 修复:tbpu合并自然段时,垂直距离不准确的Bug。
- 修复:HTTP API 的跨域问题。 (#52)
- 修复:HTTP API 传base64的大小限制问题。 (#49)
- 修复:其它少量报错。
- 翻译:人工校对
繁体中文
和英语
。 (贡献:@QZGao)
问题排查
- 如果启动
Umi-OCR.exe
遇到问题,如无画面显示或报错弹窗。可尝试以下两个备用启动器: UmiOCR-data/RUN_GUI.bat
(只启动GUI)UmiOCR-data/RUN_CLI.bat
(启动GUI和命令行,方便查看报错信息)
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄
多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Umi-OCR_Paddle_dev_20231114.7z (127MB)
SHA256: 8d4e402806c3cfe037dc07f72c4345e9abbd7cef360e31f2143ef64cfb68a69b
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
Umi-OCR_Rapid_dev_202311147z (95MB)
SHA256: 5c7999ff0aaddff371fa6e78c2e4e74964b9bb148f7054e36611bc032f8c507f
预览版 dev 20231105
V2开发计划中的预期功能已全部到位,准备在本月中下旬发布v2.0.0正式版。
关于大家关心的两个大型新功能:PDF识别、截图翻译,将在v2.1等后续版本中逐步更新。
个人业余时间开发,产能有限,请多包涵~~
协助翻译!
👉 参考文档 👈
Umi-OCR 的UI界面支持多国语言。邀请各路大佬参与翻译工作!以下是现有语言列表。
(如果你希望新增一个不在列表中的语言,需要稍微改动源码。可参考文档自己尝试,或者提个issue让我弄。)
已校对 | 未翻译 | ||
---|---|---|---|
zh_TW |
繁體中文 | es_ES |
Español |
en_US |
English | fr_FR |
Français |
de_DE |
Deutsch | ||
ko_KR |
한국어 | ||
未校对 | ru_RU |
Русский | |
ja_JP |
日本語 | pt_BR |
Português |
it_IT |
Italiano |
关于配置文件迁移
升级Umi-OCR时,如需保留旧版本配置,只需要将旧版本的以下文件放到新软件相同位置即可:
UmiOCR-data/.settings
更新日志 v2.0.0 dev 20231105
- 新增:记忆窗口位置。 (#44)
- 新增:批量识图页增加图片预览窗口,单击图片条目打开。 (#2)
- 新增:检查软件是否有权限读写配置文件。 (#30)
- 新增:报错弹窗提供一键复制及打开issues的功能。
- 新增:全局设置页添加左侧目录栏。
- 新增:插件的多国语言UI机制。
- 优化:截图预览面板中,文本框的位置更准确。
- 优化:调整部分UI布置。
- 修复:扫码模块添加导入异常检查。 (#33)
- 修复:补充扫码页的拖入图片功能。 (#43)
- 修复:输出到单独文件txt时,文件名去除原后缀。 (#36)
- 修复:一些小Bug。
问题排查
- 如果启动
Umi-OCR.exe
遇到问题,如无画面显示或报错弹窗。可尝试以下两个备用启动器: UmiOCR-data/RUN_GUI.bat
(只启动GUI)UmiOCR-data/RUN_CLI.bat
(启动GUI和命令行,方便查看报错信息)
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄
多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Umi-OCR_Paddle_dev_20231018.7z (127MB)
SHA256: f17e16686e189553ae9dfedda91b56d36aba948315bbfa96bf1ff85bb0400ccb
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
Umi-OCR_Rapid_dev_20231018.7z (95MB)
SHA256: fcc83e3b588916417aa5a37d9d69af1f3352350c254e257174602814de291f3e
预览版 dev 20231025
V2 预览版可能含有未发现的Bug,欢迎提issue。有任何意见和想法也请随意提出。
更新日志 v2.0.0 dev 20231025
- 新增:忽略区域功能。支持排除图片中的水印。
- 新增:二维码识别页。支持识别多种格式的二维码、条形码。 (Umi-OCR #95)
- 新增:命令行支持传入图片路径。 (#28)
- 新增:HTTP接口支持Base64传输图片。 (#28)
- 新增:提供备选启动器
UmiOCR-data/RUN_GUI.bat
,供Umi-OCR.exe
不兼容时使用。 (#21) - 优化:图片预览窗口,支持用
Tab
切换显示/隐藏文本。 - 优化:记录面板,每条记录顶部添加复制按钮。 (#32)
- 优化:记录面板,拖拽过程中允许指针移出文本框区域。 (#32)
- 优化:重新设计截图缓存机制,避免Image组件销毁时的内存泄露。
- 优化:标签页应用动态解析机制,小幅提高加载速度。
- 优化:运行环境转为64位包。(计划不再提供对32位的兼容)
- 修正:配置项中布尔值解析不正确的问题。 (#30)
- 修正:拖入非图片文件可能导致卡顿几秒的问题。
- 修正:PaddleOCR插件的兼容性问题。 (Umi-OCR #209)
新增文档
- 命令行手册: README_CLI
- HTTP接口手册: README_HTTP
问题排查
- 如果启动
Umi-OCR.exe
遇到问题,如无画面显示或报错弹窗。可尝试以下两个备用启动器: UmiOCR-data/RUN_GUI.bat
(只启动GUI)UmiOCR-data/RUN_CLI.bat
(启动GUI和命令行,方便查看报错信息)
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄
多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Umi-OCR_Paddle_dev_20231018.7z (127MB)
SHA256: a1b5a838d30e3d68b5292bb45b03393eabddb230f0d97124ca3fdb3752be7fe6
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
Umi-OCR_Rapid_dev_20231018.7z (95MB)
SHA256: 2b476b29df5d13c0b18f7c5f4d9736bd58a5413e00de095f39772552797fbaaa
预览版 dev 20231018
V2 预览版可能含有未发现的Bug,欢迎提issue。有任何意见和想法也请随意提出。
更新日志 v2.0.0 dev 20231018
- 新增:截图前自动隐藏窗口。 (#26)
- 新增:更改字体功能。 (#25)
- 新增:等待OCR时,显示可爱的加载动画。
- 新增:截图预览面板 支持显示结果文本、划选文本。
- 新增:截图预览面板 支持将图片复制到剪贴板。
- 新增:结果记录面板 支持跨文本框划选文本。 (#18)
- 新增:结果记录面板 支持删除一条或多条记录。 (#10)
- 新增:支持用Esc或右键中断截图。
- 新增:多个主题。
- 优化:更改插件目录结构和导入机制。
- 修正:文件重复导致无法添加开机自启。 (#27)
本次更新添加了很多魔改功能(原UI框架本身未提供的功能),尤其是跨文本框划词相关,因此可能出现我预料以外的情况和bug。还请多包涵。
遇到问题时,请在issue里尽可能详细的说明情况,如发生条件、发生概率、系统版本、报错信息、截图等。
另外,关于操作界面的快捷键(如全选、复制等),如果你有更好的建议,或者希望增加别的快捷键,也请提issue。
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄
多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Umi-OCR_Paddle_dev_20231018.7z (124MB)
SHA256: 7f387199b75a4839d93e47b7879536c345d47087daf186845ebfba449a50cd6f
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
Umi-OCR_Rapid_dev_20231018.7z (92MB)
SHA256: fe813f8181c17d9cf6f134b81ceb8404038040b6370684f216a3f15e22c59b83
预览版 dev 20231010
V2 预览版可能含有未发现的Bug,欢迎提issue。有任何意见和想法也请随意提出。
更新日志 v2.0.0 dev 20231010
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7)
- 新功能:初步实现插件机制,切换引擎等组件更加便捷。
- 新功能:支持调整界面比例(文字大小)。
- 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 (#8)
- 优化:双击通知弹窗可打开主窗口。 (#10)
- 优化:截图完成后,如果主窗口在前台,则不弹出成功提示。 (#10)
- 优化:禁用美化效果时,外部弹窗将不会渲染阴影区域。 (#14)
- 优化:Paddle引擎也支持win7系统了。
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄
多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Umi-OCR_Paddle_dev_20231010.7z (123MB)
SHA256: 67c539e14860488147332501db128ada34e3c325872005de2fb8cc086f1db8d2
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
Umi-OCR_Rapid_dev_20231010.7z (92MB)
SHA256: cc5855d3f881fa7d63a0807ac1abd18352dc928281dbb4513daaa08e65c37e41
关于插件
现在你能在 Umi-OCR 插件库 中随意下载OCR引擎插件!可以同时导入Paddle和Rapid两个插件,在全局设置中切换。体验两款引擎的区别~
未来将开放更多插件,也支持开发者贡献插件。一起拓展 Umi-OCR 的功能吧🎉
预览版 dev 20230925
V2 预览版可能含有未发现的Bug,欢迎提issue。有任何意见和想法也请随意提出。
以下的不同版本,仅OCR引擎有区别,其它功能完全一致。均附带 简中/繁中/英/日/韩/俄
多国语言识别库。
提示:若截屏时有画面闪烁的现象(尤其是N卡用户),请在全局设置
→界面和外观
→渲染器
,切换为 OpenGL ES
。
Paddle 引擎版
(仅支持Win10 x64以上,性能更好,速度快)
Umi-OCR_Paddle_win10_dev_20230925.7z (120.7MB)
SHA256: 088a11f7844bf3482c5e0a4590af62a0fe2dfb26f4f28072d8b1ca0e557276bd
Rapid 引擎版
(兼容Win7 x64 ,内存占用低,适合低配机器)
Umi-OCR_Rapid_win7_dev_20230925.7z (91.4MB)
SHA256: 7c17f10de05e9125d5a103d6a345cee65a4593b9dfe5a9c4b3161944ba53bc8e
预览版 dev 20230908
Language
用戶界面支援多種語言!
User interface supports many languages!
ソフトウェアは多言語に対応しています!
v2开发计划进入后期,正式发布不再遥远。
此版本已重构完成v1中的大部分功能,具备足够实用性。
预览版可能含较多Bug,欢迎提issue。有任何意见和想法也请随意提出。
已支持的新特性:
- 现代化UI风格
- 自定义标签页系统
- 主题切换
- 兼容高分辨率屏幕和多屏幕系统
- 更准确、智能的段落合并
- 支持多种界面语言(实验性)
Support for multiple interface languages (experimental)
(当前界面多国语言使用AI翻译生成,词义和排版可能不太恰当。正式版本会进行人工校对。)
(The current interface supports multiple languages using AI translation, so the meanings and layout may not be accurate. The official version will undergo manual proofreading.)
下一步的工作:
- 命令行模式
- 截图联动/截图翻译
- 支持Rapid引擎(Win7系统)
预览 / Preview
软件本体
Umi-OCR_v2_dev_20230908.7z
- sha256
e45ea3fa95b643bac8a5e07ff669af832aed1db7e698ab40aeacaf824649c7df
多国语言拓展包
- sha256
1dfcb8fbdc06f4e99310d3fd71f4c27949882cbf10c38de4ade8429c76c7cc92
预览版 dev 20230907
- 现代化UI风格
- 自定义标签页系统
- 主题切换
- 兼容高分辨率屏幕和多屏幕系统
- 更准确、智能的段落合并