Skip to content

Latest commit

 

History

History
111 lines (82 loc) · 3.36 KB

README.md

File metadata and controls

111 lines (82 loc) · 3.36 KB

🟪 Upstage Post OCR Parsing Project (명함 정보 추출)

Introduction

🤪 Team 유쾌한 반란

🔅 Members

김준석 서인범 송영준 심효은 정시현
Github Github Github Github Github

🔅 Contribution

  • 김준석   Image Preprocess, Serialization, Multi-threading, Text Post Process
  • 서인범   Model Research, Metric, Data Annotation
  • 송영준   Serialization, Fast API Server, Android App Develop
  • 심효은   Multi-threading, Modularity, Construct Pipeline, Refactoring
  • 정시현   Serialization, Text Pre·Post Process, Android App Develop, Refactoring

Project Outline

🎯 프로젝트 목표

  • 목적
    • 명함의 정보(이름, 직책, 주소, 회사명, 전화번호, 이메일) 추출
    • 추출된 정보를 앱의 화면으로 출력
  • 주요 기능
    • 명함 이미지 카메라로 찍거나 갤러리에서 선택 가능
    • 이미지를 정방향으로 전처리
    • 전처리된 이미지에서 원하는 정보를 추출

🏭 프로젝트 전체 구조

project_figure

Demo

👀 명함 인식 앱 구동 예시

ezgif-4-e56ff915ab

🚀 Architecture

.
├── app.py
├── main.py
├── model
│ ├── dataloader.py
│ ├── dataset.py
│ ├── inference.py
│ ├── tag2id.pkl
│ ├── train.py
│ └── utilities.py
├── calculate
│ ├── metric.py
│ └── pickle.py
├── extraction
│ ├── detection.py
│ ├── serialization.py
│ └── valid_info.py
├── preprocess
│ ├── cleansing.py
│ ├── image.py
├── union
│ ├── image.py
│ └── text.py
├── util
│ ├── log_and_config.py
│ ├── ocr_api.py
│ └── translation.py
└── yaml
│ ├── config.yaml
│ └── log_config.yaml
├── log
│ └── info.log
├── README.md
├── requirements.txt

🔨 How to Use

# 프로젝트 다운로드
git clone https://github.com/boostcampaitech2/final-project-level3-nlp-14.git
cd final-project-level3-nlp-14

pip install -r requirements.txt

python app.py

Metric 실행

python app.py --calculate True >> metric_result

🐬Docker

docker pull a2921641/post_ocr:latest
docker run a2921641/post_ocr -p 30001:30001