Skip to content

Latest commit

 

History

History
40 lines (26 loc) · 2.14 KB

README.md

File metadata and controls

40 lines (26 loc) · 2.14 KB

Trabalho prático 1

  • Nome do Aluno: ________
  • Número de Matrícula: ________
  • Disciplina: Aprendizado de Máquina
  • Semestre: 2023/1
  • Data: 15/03/2023
  • Data da entrega: 22/03/2023
  • Valor: 2,0

Orientações: preencher com seus dados antes da data de entrega

Como entregar este trabalho

Faça um fork deste repositório e faça os commits com o código que você utilizou para chegar nos resultados. Serão aceitos os commits até a data de 22/03/2023 às 18:59:59 (antes da aula).

No dia 22/03/2023 haverá uma apresentação expositiva das técnicas utilizadas e resultado.

Códigos duplicados ou com bastante semelhança terão suas notas zeradas

Dataset

O presente trabalho irá considerar o dataset presente no arquivo dataset.xlsx, que contém dados anônimos de pacientes atendidos no Hospital Israelita Albert Einstein, em São Paulo, e que tiveram amostras coletadas para realizar o SARS-CoV2-RT-PCR. Todos os dados são anonimizados. Sua tarefa será preparar a base de dados de forma a posteriormente processarmos os dados.

O primeiro passo é analizar a base de dados e considerar que a tomada de decisão pelos profissionais de saúde é um processo complexo, e que as informações presentes no seu histórico médico depende de diversos fatores, como queixas do paciente, achados em exames laboratoriais, histórico médico pessoal, hábitos de vida, histórico familiar, exposições anteriores, entre outros.

O conjunto de dados reflete a complexidade desta tomada de decisão durante o atendimento clínico de rotina, e portanto possui uma escassez maior do que dados de ambientes de pesquisa mais controlados.

Desta forma, sua tarefa será tratar a base de dados datasets.xlsx, analisando e aplicando técnicas para os seguintes tópicos:

  • Detecção de inconsistência e dados inválidos;
  • Detecção de outliers;
  • Detecção de dados faltantes.

Tópicos de avaliação

  • Detecção de dados faltantes, inconsistências, dados inválidos e outliers utilizando métodos presentes na literatura;
  • Detalhamento e justificativa das técnicas utilizadas;
  • Análise dos códigos entregues;
  • Apresentação expositiva dos resultados.