model-training

Clovaai deep-text-recognition-benchmark를 참고하여 프로젝트 진행

About The Project

Project Files Description

dataset_preprocess.py
- 한글 데이터셋 저장 (from AIHub)
- Create Dataset Annotation File
dataset_preprocess_2.py
- 1에서 생성한 Annotation File 통해 단어 단위로 crop후 save
- Create gt.txt
- 해당 블로그의 코드 참고함. 링크

create_lmdb_dataset.py

Create lmdb dataset
폴더의 구조는 아래와 같아야 함.

data
 ├── gt.txt
 └── test
   ├── word_1.png
   ├── word_2.png
   ├── word_3.png
   └── ...

gt.txt의 구조는 아래와 같아야 함.

test/word_1.png Tiredness
test/word_2.png kills
test/word_3.png A
...

실행

python create_lmdb_dataset.py --inputPath data/ --gtFile data/gt.txt --outputPath result/

train.py

train start
본 프로젝트에서는 TPS-ResNet-BiLSTM-Attn 구조 사용
- 해당 내용은 논문 스포츠 중계 영상 내 문자 인식 모델의 성능 분석 연구 참고

python train.py \
 --train_data data_lmdb_release/training --valid_data data_lmdb_release/validation \
 --Transformation TPS --FeatureExtraction ResNet --SequenceModeling BiLSTM --Prediction Attn

Please refer to the link for more detailed information.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
modules		modules
README.md		README.md
create_lmdb_dataset.py		create_lmdb_dataset.py
dataset.py		dataset.py
dataset_preprocess.py		dataset_preprocess.py
dataset_preprocess_2.py		dataset_preprocess_2.py
model.py		model.py
test.py		test.py
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

model-training

About The Project

Project Files Description

About

Releases

Packages

Languages

Sporty-OCR/model-training

Folders and files

Latest commit

History

Repository files navigation

model-training

About The Project

Project Files Description

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages