Utilities per predisporre i dati di TilStat
Per contribuire, leggi la sezione apposita.
Questo script è parte di TilStat, un tool che nasce per raccogliere in modo non-ufficiale varie statistiche sul TIL, il test d'ingresso del Politecnico di Torino; cos� come altre satistiche sul Politecnico stesso.
Ci sono due notebook. Tilstat scraper 17-18 20-21.ipynb
(poco commentato) consente di leggere le graduatorie di ingegneria fino al 2021 incluso e le altra graduatorie fino ad oggi; Tilstat scraper 21-22.ipynb
(abbastanza commentato) legge le successive di ingegneria. Tilstat merger.ipynb
legge gli output degli scraper e li trasforma in un formato json compatto.
TL;DR
Installa Poetry, un tool alternativo a venv e freeze:
curl -sSL https://install.python-poetry.org | python3 -
Aggiungi il comando poetry
alla Path, poi esegui nella root del progetto:
poetry install
poetry run jupyter notebook
Il progetto usa Poetry, un tool per Python che gestisce sia dipendenze che virtual-env. Poetry non fa niente più rispetto a virtualenv e pip freeze, ma nella mia limitata esperienza tende a farlo meglio e con meno rogne. Dipendenze ed informazioni sul progetto sono salvate tutte in un'unico file, pyproject.toml
, mentre poetry.lock
è un file tenuto aggiornato automaticamente da Poetry che memorizza l'intera catena delle dipendenze, il che rende di solito indolore spostarsi di macchina.
-
Creare virtualenv ed installare le dipendenze:
poetry install
-
Attivare il virtualenv: non serve. Tutti gli script eseguiti con
poetry run
nella directory del progetto vengono interpretati nel giusto contesto. -
Runnare jupyter:
poetry run jupyter notebook
-
Runnare uno script qualsiasi:
poetry run python script.py
-
Aggiungere o rimuovere una dipendenza da pipy:
poetry add nome_dipendenza
oppurepoetry remove nome_dipendenza
-
Tutti i comandi sinora detti aggiornano in automatico la catena di dipendenza, e garantiscono la coerenza. Se vuoi farti del male puoi aggiornare le dipendenze modificando
pyproject.toml
a mano, ma devi comunicarlo a Poetry con il comandopoetry lock
"# tilstat-data"