TiramisuSELD 🍰

Sound Event Localization and Detection in Tensorflow 2

TiramisuSELD implements some speech event localization and detection architectures.

Requirements

Python 3.6+
Tensorflow 2.2+: pip install tensorflow

Setup Environment and Datasets

Install tensorflow: pip3 install tensorflow or pip3 install tf-nightly (for using tflite)

Install packages: python3 setup.py install

To enable XLA, run TF_XLA_FLAGS=--tf_xla_auto_jit=2 $python_train_script

Clean up: python3 setup.py clean --all (this will remove /build contents)

Training & Testing

Example YAML Config Structure

speech_config: ...
model_config: ...
decoder_config: ...
learning_config:
  augmentations: ...
  dataset_config:
    train_paths: ...
    eval_paths: ...
    test_paths: ...
    tfrecords_dir: ...
  optimizer_config: ...
  running_config:
    batch_size: 8
    num_epochs: 20
    outdir: ...
    log_interval_steps: 500

See examples for some predefined ASR models.

References & Credits

https://github.com/pquochuy/dcase2020-seld

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
tiramisu_seld		tiramisu_seld
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
setup.cfg		setup.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TiramisuSELD 🍰

Sound Event Localization and Detection in Tensorflow 2

Requirements

Setup Environment and Datasets

Training & Testing

References & Credits

About

Releases

Packages

Languages

License

nglehuy/TiramisuSELD

Folders and files

Latest commit

History

Repository files navigation

TiramisuSELD 🍰

Sound Event Localization and Detection in Tensorflow 2

Requirements

Setup Environment and Datasets

Training & Testing

References & Credits

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages