통계/딥러닝 기반 인식기법 실습 IDE download: pycharm
실험을 수행하는데 필요한 패키지를 정리한 파일입니다.
pip install -r requirements.txt
log-mel spectrum(.ls)과 MFCC(.mfc) 특징을 추출하여 저장
python ./utils/feature_extractor.py
사용할 특징과 모델을 매개변수로 넣어 훈련 (default: mel / gmm)
python train.py --isTrain 1 --data [특징타입] --model [모델]
- MFCC 특징을 사용하여 CNN모델을 훈련할 경우 아래와 같이 수행
python train.py --isTrain 1 --data mfc --model cnn
사용된 특징과 모델을 매개변수로 넣어 테스트 (default: mel / gmm)
python train.py --isTrain 0 --data [특징타입] --model [모델]
- MFCC 특징을 사용하여 훈련된 CNN모델의 성능을 평가할 경우 아래와 같이 수행
python train.py --isTrain 0 --data mfc --model cnn
- 0~2단계를 선택하여 매개변수로 넣어 특징추출/모델훈련/모델추론 과정 수행
- 선택한 단계의 상위 단계 모두 수행 (ex. --step 0; 0~2단계 수행)
python run.py --step [수행단계]
log-mel spectrum (mel)
MFCC (mfc)
KMEANS (kmeans)
GMM (gmm)
HMM (hmm)
FC-DNN (dnn)
CNN (cnn)
LSTM (rnn)
- UrbanSound8K는 8,732개 sample로 구성(10개 class, 4초이하)
- Download form을 작성 후 다운 받아, repository에 있는 ./data/wav/* 에 압축해제
Copyright (c) 2020-IMPRESS.