- RStudio: Ambiente integrado para desenvolvimento em R, oferecendo ferramentas para escrita, execução e depuração de código.
- Ggplot2: Pacote para criação de visualizações de dados elegantes e flexíveis em R.
- Tidyverse: Conjunto de pacotes para manipulação de dados, visualização e modelagem em R, seguindo o paradigma "tidy data".
- Corrplot: Pacote em R que fornece ferramentas para visualização de matrizes de correlação. Permite criar gráficos de correlação de maneira simples e intuitiva, utilizando diferentes métodos de visualização, como círculos, elipses, quadrados e outras formas, facilitando a análise e interpretação das correlações entre variáveis.
Redes neurais são modelos computacionais inspirados no cérebro humano, usados em aprendizado de máquina e inteligência artificial. Elas consistem em camadas de neurônios conectados, onde cada conexão tem um peso ajustável. A camada de entrada recebe dados, camadas ocultas processam esses dados e a camada de saída produz o resultado final. Cada neurônio aplica uma função de ativação para transformar suas entradas em saídas. Redes neurais são particularmente eficazes em tarefas como reconhecimento de imagem, processamento de linguagem natural e previsão de séries temporais, graças à sua capacidade de aprender e modelar relacionamentos complexos nos dados.
Objetivo: Seu modelo deve prever a MEDV (Valor da Mediana de ocupação das casas). Utilize um modelo de rede neural!
Dicionário de dados:
- CRIM - taxa de criminalidade per capita por cidade
- ZN - proporção de terrenos residenciais zoneados para lotes acima de 25.000 pés quadrados
- INDUS - proporção de acres de negócios não varejistas por cidade
- CHAS - variável fictícia do Rio Charles (1 se o lote faz divisa com o rio; 0 caso contrário)
- NOX - concentração de óxidos de nitrogênio (partes por 10 milhões)
- RM - número médio de quartos por habitação
- AGE - proporção de unidades ocupadas por proprietários construídas antes de 1940
- DIS - distâncias ponderadas para cinco centros de emprego de Boston
- RAD - índice de acessibilidade a rodovias radiais
- TAX - taxa de imposto sobre propriedade de valor total por 10.000
- PTRATIO - relação aluno-professor por cidade
- B - 1000(Bk - 0,63)^2 onde Bk é a proporção de negros por cidade
- LSTAT - % de população de status socioeconômico inferior
- MEDV - valor mediano das casas ocupadas por proprietários em milhares de dólares
Fonte de Dados e dicionário: https://archive.ics.uci.edu/ml/datasets/Student+Performance
Referências: Formação Cientista de Dados (https://www.datascienceacademy.com.br/)