目前NLP+OCR的落地应用在市场上愈加火热,如金融领域的研报分析、司法领域的合同审核甚至知识图谱的信息抽取,无不显示着NLP与OCR融合的巨大魅力。
本文将针对OCR从理论和实战两方面进行详细论述,当然,不会涉及过多的公式,网上对于公式解析已经很全面,若感兴趣可自行查找。
本项目下的所有模型均在以下环境中测试成功:
python版本:python3.6
系统:ubuntu18.04
pytorch:1.2.0
tensorflow:1.14.0
(一)OCR深度实践系列:图像预处理
(二)OCR深度实践系列:数据生成
(三)OCR深度实践系列:文本检测
(四)OCR深度实践系列:文本识别
(五)OCR深度实践系列:后处理篇