Skip to content

Commit 868777c

Browse files
committed
update 20231018
1 parent b047b5b commit 868777c

6 files changed

+79
-38
lines changed

README.md

+78-37
Original file line numberDiff line numberDiff line change
@@ -48,10 +48,11 @@
4848
- **免费**:本项目所有代码开源,完全免费。
4949
- **方便**:解压即用,离线运行,无需网络。
5050
- **批量**:支持批量导入处理图片。也可以即时截屏识别。
51-
- **高效**采用 PaddleOCR / RapidOCR 识别引擎。只要电脑性能足够,可以比在线OCR服务更快。
51+
- **高效**自带高效的离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
5252
- **灵活**:支持定制界面,支持命令行、HTTP接口等多种调用方式。
5353

54-
![Preview1.png](https://tupian.li/images/2023/09/25/65119e87d359c.png)
54+
55+
![Umi-OCR-截图页2.png](https://tupian.li/images/2023/10/18/652fed59f21c8.png)
5556
![i18n.png](https://tupian.li/images/2023/09/25/65119e87e8041.png)
5657

5758
## 源码:
@@ -68,23 +69,55 @@
6869
6970
[Umi-OCR_plugins](https://github.com/hiroi-sora/Umi-OCR_plugins) -->
7071

71-
#### v1.3.6 稳定版本
72+
#### v1.3 稳定版本
7273

7374
[Umi-OCR 主仓库](https://github.com/hiroi-sora/Umi-OCR)
7475

75-
## 主要功能:
76+
## 标签页
77+
78+
Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。
79+
80+
### 截图OCR
81+
82+
![Umi-OCR-截图页1.png](https://tupian.li/images/2023/10/18/652fea30b095b.png)
83+
84+
**截图OCR**:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。
85+
- 左侧的图片预览栏,可直接用鼠标划选复制。
86+
- 右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。
87+
- 也支持在别处复制图片,粘贴到Umi-OCR进行识别。
88+
89+
---
90+
91+
### 批量OCR
92+
93+
![Umi-OCR-批量页1.png](https://tupian.li/images/2023/10/18/652fefa69c9b8.png)
94+
95+
**批量OCR**:这一页支持批量导入本地图片并识别。
96+
- 识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。
97+
- 支持`文本后处理`技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。
98+
- 没有数量上限,可一次性导入几百张图片进行任务。
99+
- 支持任务完成后自动关机/待机。
100+
101+
---
102+
103+
### 全局设置
104+
105+
![Umi-OCR-全局页1.png](https://tupian.li/images/2023/10/18/652ff116f0f15.png)
106+
107+
**全局设置**:在这里可以调整软件的全局参数。
108+
- 支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行)
109+
- 支持切换界面主题。Umi-OCR拥有多个亮/暗主题。
110+
- 可以调整界面文字大小、文字字体。
111+
- 切换OCR插件。
112+
113+
---
76114

77-
目前 Umi-OCR v2 具有两大主要功能:
78-
- **截图OCR**:用快捷键唤起截图,识别截图中的文字。也支持识别剪贴板中的图片。
79-
- **批量OCR**:支持批量导入本地图片,将识别的内容保存为 txt / jsonl / md 等多种格式的文件。
80115

81-
一张标签页负责一种主要功能。您可按习惯,打开或关闭不同功能页。
82116

83117
## 辅助功能说明:
84118

85119
- **多国语言界面**:软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。
86-
- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置``界面和外观``渲染器` 。N卡用户切换为`Opengl ES`可以达到不错的效果。`关闭硬件加速` 则可以解决大部分UI问题。
87-
- **主题**:目前支持切换浅色/深色主题。后期会推出更多主题,及开放自定义主题系统。
120+
- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置``界面和外观``渲染器`
88121
- **文本块后处理(段落合并)** 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下:
89122
- **单行**:合并同一行的文字,适合绝大部分情景。
90123
- **多行-自然段**:智能识别、合并属于同一段落的文字,适合绝大部分情景。
@@ -182,40 +215,36 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
182215

183216
## 开发计划
184217

185-
##### 基础开发计划
186-
187218
<details>
188-
<summary>已全部完成。</summary>
189-
190-
- 标签页框架。
191-
- OCR API控制器。
192-
- OCR 任务控制器。
193-
- 主题管理器,支持切换浅色/深色主题主题。
194-
- 实现 **批量OCR**
195-
- 实现 **截图OCR**
196-
- 快捷键机制。
197-
- 系统托盘菜单。
198-
- 文本块后处理(排版优化)。
199-
- 引擎内存清理。
200-
- 软件界面多国语言。
201-
- 命令行模式。
202-
- Win7兼容。
219+
<summary>已完成的工作</summary>
220+
221+
- 标签页框架。
222+
- OCR API控制器。
223+
- OCR 任务控制器。
224+
- 主题管理器,支持切换浅色/深色主题主题。
225+
- 实现 **批量OCR**
226+
- 实现 **截图OCR**
227+
- 快捷键机制。
228+
- 系统托盘菜单。
229+
- 文本块后处理(排版优化)。
230+
- 引擎内存清理。
231+
- 软件界面多国语言。
232+
- 命令行模式。
233+
- Win7兼容。
234+
- Excel(csv)输出格式。
235+
- `Esc`中断截图操作
236+
- 外置主题文件
237+
- 字体切换
238+
- 加载动画
203239

204240
</details>
205241

206-
##### 近期工作
207-
208-
- [x] `Esc`中断截图操作
209-
- [x] 外置主题文件
210-
- [ ] 字体切换
211-
- [ ] 加载动画
212242

213243
##### 近期开发计划
214244

215245
近期准备进行的工作,将会在 v2 头几个版本内逐步上线。
216246

217247
- [ ] 制订软件界面翻译的开源协作机制。
218-
- [ ] Excel输出格式。
219248
- [ ] 快捷键权限优化。
220249
- [ ] 允许隐藏托盘图标。
221250
- [ ] 截图联动/截图翻译。
@@ -248,15 +277,15 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
248277

249278
## 构建项目
250279

251-
### clone
280+
### 第一步:下载代码
252281

253282
强烈建议只 clone 主分支,因为某些分支含有体积很大的二进制库,会让你花费很长时间下载。
254283

255284
```
256285
git clone --branch main --single-branch [email protected]:hiroi-sora/Umi-OCR_v2.git
257286
```
258287

259-
### 运行环境
288+
### 第二步:运行环境
260289

261290
根据下列文档,完成对应平台的开发/运行环境部署。
262291

@@ -265,8 +294,20 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
265294

266295
## 更新日志
267296

297+
##### v2.0.0 dev `2023.10.18`
298+
- 新增:截图前自动隐藏窗口。 (#26)
299+
- 新增:更改字体功能。 (#25)
300+
- 新增:截图预览面板 支持显示结果文本、划选文本。
301+
- 新增:截图预览面板 支持将图片复制到剪贴板。
302+
- 新增:结果记录面板 支持跨文本框划选文本。 (#18)
303+
- 新增:结果记录面板 支持删除一条或多条记录。 (#10)
304+
- 新增:支持用Esc或右键中断截图。
305+
- 优化:更改插件目录结构和导入机制。
306+
- 修正:文件重复导致无法添加开机自启。 (#27)
307+
308+
268309
##### v2.0.0 dev `2023.10.10`
269-
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7)
310+
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7)
270311
- 新功能:初步实现插件机制,切换引擎等组件更加便捷。
271312
- 新功能:支持调整界面比例(文字大小)。
272313
- 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 (#8)

UmiOCR-data/version.py

+1-1
Original file line numberDiff line numberDiff line change
@@ -9,6 +9,6 @@
99
# 预发布阶段
1010
PRE_RELEASE = "dev"
1111
# 预发布版本号
12-
PRE_RELEASE_VERSION = 20231010
12+
PRE_RELEASE_VERSION = 20231018
1313

1414
# TODO: 补充更多信息

docs/images/Umi-OCR-全局页1.png

57.4 KB
Loading

docs/images/Umi-OCR-截图页1.png

126 KB
Loading

docs/images/Umi-OCR-截图页2.png

144 KB
Loading

docs/images/Umi-OCR-批量页1.png

140 KB
Loading

0 commit comments

Comments
 (0)