48
48
- ** 免费** :本项目所有代码开源,完全免费。
49
49
- ** 方便** :解压即用,离线运行,无需网络。
50
50
- ** 批量** :支持批量导入处理图片。也可以即时截屏识别。
51
- - ** 高效** :采用 PaddleOCR / RapidOCR 识别引擎 。只要电脑性能足够,可以比在线OCR服务更快。
51
+ - ** 高效** :自带高效的离线OCR引擎 。只要电脑性能足够,可以比在线OCR服务更快。
52
52
- ** 灵活** :支持定制界面,支持命令行、HTTP接口等多种调用方式。
53
53
54
- ![ Preview1.png] ( https://tupian.li/images/2023/09/25/65119e87d359c.png )
54
+
55
+ ![ Umi-OCR-截图页2.png] ( https://tupian.li/images/2023/10/18/652fed59f21c8.png )
55
56
![ i18n.png] ( https://tupian.li/images/2023/09/25/65119e87e8041.png )
56
57
57
58
## 源码:
68
69
69
70
[Umi-OCR_plugins](https://github.com/hiroi-sora/Umi-OCR_plugins) -->
70
71
71
- #### v1.3.6 稳定版本
72
+ #### v1.3 稳定版本
72
73
73
74
[ Umi-OCR 主仓库] ( https://github.com/hiroi-sora/Umi-OCR )
74
75
75
- ## 主要功能:
76
+ ## 标签页
77
+
78
+ Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。
79
+
80
+ ### 截图OCR
81
+
82
+ ![ Umi-OCR-截图页1.png] ( https://tupian.li/images/2023/10/18/652fea30b095b.png )
83
+
84
+ ** 截图OCR** :打开这一页后,就可以用快捷键唤起截图,识别图中的文字。
85
+ - 左侧的图片预览栏,可直接用鼠标划选复制。
86
+ - 右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。
87
+ - 也支持在别处复制图片,粘贴到Umi-OCR进行识别。
88
+
89
+ ---
90
+
91
+ ### 批量OCR
92
+
93
+ ![ Umi-OCR-批量页1.png] ( https://tupian.li/images/2023/10/18/652fefa69c9b8.png )
94
+
95
+ ** 批量OCR** :这一页支持批量导入本地图片并识别。
96
+ - 识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。
97
+ - 支持` 文本后处理 ` 技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。
98
+ - 没有数量上限,可一次性导入几百张图片进行任务。
99
+ - 支持任务完成后自动关机/待机。
100
+
101
+ ---
102
+
103
+ ### 全局设置
104
+
105
+ ![ Umi-OCR-全局页1.png] ( https://tupian.li/images/2023/10/18/652ff116f0f15.png )
106
+
107
+ ** 全局设置** :在这里可以调整软件的全局参数。
108
+ - 支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行)
109
+ - 支持切换界面主题。Umi-OCR拥有多个亮/暗主题。
110
+ - 可以调整界面文字大小、文字字体。
111
+ - 切换OCR插件。
112
+
113
+ ---
76
114
77
- 目前 Umi-OCR v2 具有两大主要功能:
78
- - ** 截图OCR** :用快捷键唤起截图,识别截图中的文字。也支持识别剪贴板中的图片。
79
- - ** 批量OCR** :支持批量导入本地图片,将识别的内容保存为 txt / jsonl / md 等多种格式的文件。
80
115
81
- 一张标签页负责一种主要功能。您可按习惯,打开或关闭不同功能页。
82
116
83
117
## 辅助功能说明:
84
118
85
119
- ** 多国语言界面** :软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。
86
- - ** 渲染器** :软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 ` 全局设置 ` → ` 界面和外观 ` → ` 渲染器 ` 。N卡用户切换为` Opengl ES ` 可以达到不错的效果。` 关闭硬件加速 ` 则可以解决大部分UI问题。
87
- - ** 主题** :目前支持切换浅色/深色主题。后期会推出更多主题,及开放自定义主题系统。
120
+ - ** 渲染器** :软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 ` 全局设置 ` → ` 界面和外观 ` → ` 渲染器 ` 。
88
121
- ** 文本块后处理(段落合并)** 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下:
89
122
- ** 单行** :合并同一行的文字,适合绝大部分情景。
90
123
- ** 多行-自然段** :智能识别、合并属于同一段落的文字,适合绝大部分情景。
@@ -182,40 +215,36 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
182
215
183
216
## 开发计划
184
217
185
- ##### 基础开发计划
186
-
187
218
<details >
188
- <summary >已全部完成。</summary >
189
-
190
- - 标签页框架。
191
- - OCR API控制器。
192
- - OCR 任务控制器。
193
- - 主题管理器,支持切换浅色/深色主题主题。
194
- - 实现 ** 批量OCR** 。
195
- - 实现 ** 截图OCR** 。
196
- - 快捷键机制。
197
- - 系统托盘菜单。
198
- - 文本块后处理(排版优化)。
199
- - 引擎内存清理。
200
- - 软件界面多国语言。
201
- - 命令行模式。
202
- - Win7兼容。
219
+ <summary >已完成的工作</summary >
220
+
221
+ - 标签页框架。
222
+ - OCR API控制器。
223
+ - OCR 任务控制器。
224
+ - 主题管理器,支持切换浅色/深色主题主题。
225
+ - 实现 ** 批量OCR** 。
226
+ - 实现 ** 截图OCR** 。
227
+ - 快捷键机制。
228
+ - 系统托盘菜单。
229
+ - 文本块后处理(排版优化)。
230
+ - 引擎内存清理。
231
+ - 软件界面多国语言。
232
+ - 命令行模式。
233
+ - Win7兼容。
234
+ - Excel(csv)输出格式。
235
+ - ` Esc ` 中断截图操作
236
+ - 外置主题文件
237
+ - 字体切换
238
+ - 加载动画
203
239
204
240
</details >
205
241
206
- ##### 近期工作
207
-
208
- - [x] ` Esc ` 中断截图操作
209
- - [x] 外置主题文件
210
- - [ ] 字体切换
211
- - [ ] 加载动画
212
242
213
243
##### 近期开发计划
214
244
215
245
近期准备进行的工作,将会在 v2 头几个版本内逐步上线。
216
246
217
247
- [ ] 制订软件界面翻译的开源协作机制。
218
- - [ ] Excel输出格式。
219
248
- [ ] 快捷键权限优化。
220
249
- [ ] 允许隐藏托盘图标。
221
250
- [ ] 截图联动/截图翻译。
@@ -248,15 +277,15 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
248
277
249
278
## 构建项目
250
279
251
- ### clone
280
+ ### 第一步:下载代码
252
281
253
282
强烈建议只 clone 主分支,因为某些分支含有体积很大的二进制库,会让你花费很长时间下载。
254
283
255
284
```
256
285
git clone --branch main --single-branch [email protected] :hiroi-sora/Umi-OCR_v2.git
257
286
```
258
287
259
- ### 运行环境
288
+ ### 第二步: 运行环境
260
289
261
290
根据下列文档,完成对应平台的开发/运行环境部署。
262
291
@@ -265,8 +294,20 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
265
294
266
295
## 更新日志
267
296
297
+ ##### v2.0.0 dev ` 2023.10.18 `
298
+ - 新增:截图前自动隐藏窗口。 (#26 )
299
+ - 新增:更改字体功能。 (#25 )
300
+ - 新增:截图预览面板 支持显示结果文本、划选文本。
301
+ - 新增:截图预览面板 支持将图片复制到剪贴板。
302
+ - 新增:结果记录面板 支持跨文本框划选文本。 (#18 )
303
+ - 新增:结果记录面板 支持删除一条或多条记录。 (#10 )
304
+ - 新增:支持用Esc或右键中断截图。
305
+ - 优化:更改插件目录结构和导入机制。
306
+ - 修正:文件重复导致无法添加开机自启。 (#27 )
307
+
308
+
268
309
##### v2.0.0 dev ` 2023.10.10 `
269
- - 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7 )
310
+ - 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题。 (#7 )
270
311
- 新功能:初步实现插件机制,切换引擎等组件更加便捷。
271
312
- 新功能:支持调整界面比例(文字大小)。
272
313
- 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 (#8 )
0 commit comments