💖目前,我们自豪地推出了运行速度最为迅猛、兼容性最为广泛的多平台多语言OCR工具,它完全开源免费,并支持离线环境下的快速部署。其核心亮点在于采用ONNXRuntime作为推理引擎,相比传统的PaddlePaddle推理引擎,速度实现了4至5倍的提升,同时彻底解决了内存泄露问题,确保了高效稳定的运行。
🦜 支持语言概览: 默认支持中文与英文识别,对于其他语言的识别需求,我们提供了便捷的自助转换方案。具体转换指南,请参见这里。
🔎 项目缘起: 鉴于PaddleOCR在工程化方面仍有进一步优化的空间,为了简化并加速在各种终端设备上进行OCR推理的过程,我们创新地将PaddleOCR中的模型转换为了高度兼容的ONNX格式,并利用Python、C++、Java、C#等多种编程语言,实现了跨平台的无缝移植,让广大开发者能够轻松上手,高效应用。
🎓 名称寓意: RapidOCR,这一名称蕴含着我们对产品的深刻期待——轻快(操作简便,响应迅速)、好省(资源占用低,成本效益高)并智能(基于深度学习的强大技术,精准高效)。我们专注于发挥人工智能的优势,打造小巧而强大的模型,将速度视为不懈追求,同时确保识别效果的卓越。
😉 使用指南:
- 直接部署:若本仓库中已提供的模型能满足您的需求,那么您只需参考官方文档进行RapidOCR的部署与使用即可。
- 定制化微调:若现有模型无法满足您的特定需求,您可以在PaddleOCR的基础上,利用自己的数据进行微调,随后再将其应用于RapidOCR的部署中,实现个性化定制。
如果您发现本仓库对您的项目或学习有所助益,恳请您慷慨地给个小星星⭐,给予我们支持与鼓励!
效果展示 (more)
🎉 2024-09-06: RapidOCR获得2024中国互联网发展创新与投资大赛(开源)二等奖
pip install rapidocr_onnxruntime
from rapidocr_onnxruntime import RapidOCR
engine = RapidOCR()
img_path = 'tests/test_files/ch_en_num.jpg'
result, elapse = engine(img_path)
print(result)
print(elapse)
完整文档请移步:docs
Used by link
- 非常感谢DeliciaLaniD修复ocrweb中扫描动画起始位置错位问题。
- 非常感谢zhsunlight关于参数化调用GPU推理的建议以及细致周到的测试。
- 非常感谢lzh111222334修复python版本下rec前处理部分bug。
- 非常感谢AutumnSun1996在#42中的建议。
- 非常感谢DeadWood8提供了Nuitka打包rapidocr_web的操作文档和可执行exe。
- 非常感谢Loovelj指出对文本检测框排序时顺序问题,详情参见issue 75。
-
微信扫描以下二维码,关注RapidAI公众号,回复OCR即可加入RapidOCR微信交流群:
-
欢迎加入我们的QQ群下载模型及测试程序。1群:
887298230已满,2群:755960114已满,3群:450338158已满, 4群:419196348
Important
如果您想要赞助该项目,可直接点击当前页最上面的Sponsor按钮,请写好备注(您的Github账号名称),方便添加到下面赞助列表中。
赞助者 | 应用的产品 |
---|---|
- |
如果您发现该项目对您的研究有用,请考虑引用:
@misc{RapidOCR 2021,
title={{Rapid OCR}: OCR Toolbox},
author={RapidAI Team},
howpublished = {\url{https://github.com/RapidAI/RapidOCR}},
year={2021}
}
OCR模型版权归百度所有,其他工程代码版权归本仓库所有者所有。
该项目采用 Apache 2.0 license 开源许可证。