University of Buenos Aires (UBA)
Master in Data Mining and Knowledge Discovery
Aprendizaje Automatico
- Abrir Notebooks en github desde colab
- Calcular correlación numéricas vs. categóricas
- Balancear los datos: se pueden duplicar las instancias, pero hay distintos métodos
- FBeta: pondera de acuerdo al beta el peso de recall y precision
- SMOTE for Imbalanced Classification with Python
Paso 1: Descargar el repositorio.
$ git clone https://github.com/magistery-tps/aa-tp1.git
$ cd aa-tp1
Paso 2: Instalar anaconda (Necesario para instalar las dependencias del proyecto).
$ wget http://repo.continuum.io/archive/Anaconda3-5.0.0-Linux-x86_64.sh
$ sh Anaconda3-5.0.0-Linux-x86_64.sh
$ source ~/.bashrc (o source ~/.zshrc)
Paso 3: Crear environment de dependencias para el proyecto (Parado en el directorio del proyecto).
$ conda env create -f environment.yml
Nota: Se peude mamba en vez de conda. Mamba es 100 veces mas rapido que conda.
$ conda install mamba
$ mamba env create -f environment.yml
Si agregamos nuevas dependencias en environment.yml
para instalarlas es necesario correr el siguiente comando:
$ conda env update -f environment.yml
Paso 1: Activamos el entorno donde se encuentran instaladas las dependencias del proyecto.
$ conda activate aa-tp1
Paso 2: Sobre el directorio del proyecto levantamos jupyter lab.
$ jupyter lab
Jupyter Notebook 6.1.4 is running at:
http://localhost:8888/?token=45efe99607fa6......
Paso 3: Ir a http://localhost:8888.... como se indica en la consola.
Paso 1: Instalar tema.
$ jupyter labextension install @oriolmirosa/jupyterlab_materialdarker
Paso 2: Reiniciar Jupyter Lab