Skip to content

Latest commit

 

History

History
39 lines (26 loc) · 1.28 KB

README.md

File metadata and controls

39 lines (26 loc) · 1.28 KB

Análise de dados de qualidade da água em praias de Chicago

Este projeto tem como objetivo realizar uma análise exploratória dos dados de qualidade da água em praias de Chicago e aplicar técnicas de clusterização para identificar possíveis grupos de praias com características semelhantes.

Instalação

O projeto requer as seguintes bibliotecas:

  • pandas
  • matplotlib
  • seaborn
  • scikit-learn
  • plotly
  • scipy

As bibliotecas podem ser instaladas utilizando o pip, por exemplo:

pip install pandas matplotlib seaborn scikit-learn plotly scipy

Utilização

O arquivo data.csv contém os dados brutos utilizados na análise. Para executar a análise e gerar os resultados, execute o notebook analysis.ipynb.

O notebook contém as seguintes seções:

  1. Carregamento e visualização dos dados
  2. Pré-processamento dos dados
  3. Análise exploratória dos dados
  4. Clusterização com K-means
  5. Clusterização com Hierarchical Clustering
  6. Clusterização com DBSCAN

Para visualizar os resultados, basta executar todas as células do notebook. Os resultados serão apresentados na forma de gráficos e tabelas.

Contribuição

Contribuições são bem-vindas. Para sugestões, reportar erros ou problemas, por favor, abra uma issue no repositório do projeto.