Clovaai deep-text-recognition-benchmark를 참고하여 프로젝트 진행
-
dataset_preprocess.py
- 한글 데이터셋 저장 (from AIHub)
- Create Dataset Annotation File
-
dataset_preprocess_2.py
-
1에서 생성한 Annotation File 통해 단어 단위로 crop후 save
-
Create gt.txt
-
해당 블로그의 코드 참고함. 링크
-
-
create_lmdb_dataset.py
- Create lmdb dataset
- 폴더의 구조는 아래와 같아야 함.
data ├── gt.txt └── test ├── word_1.png ├── word_2.png ├── word_3.png └── ...
- gt.txt의 구조는 아래와 같아야 함.
test/word_1.png Tiredness test/word_2.png kills test/word_3.png A ...
- 실행
python create_lmdb_dataset.py --inputPath data/ --gtFile data/gt.txt --outputPath result/
-
train.py
- train start
- 본 프로젝트에서는 TPS-ResNet-BiLSTM-Attn 구조 사용
- 해당 내용은 논문
스포츠 중계 영상 내 문자 인식 모델의 성능 분석 연구
참고
- 해당 내용은 논문
python train.py \ --train_data data_lmdb_release/training --valid_data data_lmdb_release/validation \ --Transformation TPS --FeatureExtraction ResNet --SequenceModeling BiLSTM --Prediction Attn
Please refer to the link for more detailed information.