Olá, meu nome é Pedro Henrique, e esse é meu repositório referente ao projeto final do módulo 2 do Bootcamp De Data Science Aplicada promovido pela Alura sobre Visualização de dados com Seaborn e Matplotlib.O objetivo desse projeto foi utilizar dados do Projeto Nacional de Imunização(PNI) em conjunto com outras bases de dados a fim de contar uma história com esses dados, eu optei por explorar os dados sobre a vacinação contra a hepatite e analisar os casos e óbitos no Brasil a partir de dados do SUS(Sistema Único de Saúde).
A palavra hepatite vem do Grego “HEPAR”, que significa “fígado”, e a terminação “ITIS” foi adotada pelo linguajar médico para designar “doença inflamatória”, ou seja, uma hepatite é uma doença inflamatória que ataca o fígado e podem ser causadas por alguns remédios, álcool e outras drogas, doenças autoimunes, metabólicas e genéticas, porém nesse projeto o foco são as hepatites virais, que são aquelas infecções causadas por vírus.
O fígado é é considerado um dos maiores órgãos do corpo humano, ele é responsável por diversas funções cruciais para o corpo humano, tais como a síntese da maioria das proteínas produzidas no corpo, armazenamento de vitaminas e minerais, degradação de hormônios, armazenamento de substâncias, como o glicogênio, além disso ele produz a bile, que desempenha, principalmente, um papel na excreção de substâncias tóxicas e na absorção de gorduras e vitaminas lipossolúveis, quebrando as moléculas de gorduras em ácidos graxos, que são mais facilmente absorvidos no intestino delgado.
Vários vírus podem causar quadros de inflamação do fígado, ou seja, hepatite. Porém, as chamadas hepatites virais são apenas aquelas causadas por vírus que atacam preferencialmente o fígado, portanto, até hoje foram descobertas 5 hepatites virais causadas por diferentes vírus, sendo elas a Hepatite A, B, C, D e E, porém as duas últimas(D e E) não são tão comuns no Brasil e portanto nesse projeto o foco será na hepatite A, B e C.
Causada pelo vírus A (HAV) da hepatite, a hepatite A ,na maioria dos casos, é uma doença de caráter benigno e raramente provoca hepatite crônica, contudo sua letalidade aumenta com a idade podendo provocar sintomas de hepatite aguda em pessoas mais velhas. Sua transmissão é fecal-oral, por contato entre indivíduos ou por meio de água ou alimentos contaminados pelo vírus. A hepatite A possui cura e existe vacina, a mesma é eficaz em cerca de 95% dos casos, dura pelo menos quinze anos e, possivelmente, a vida inteira da pessoa.
A hepatite B, transmitida pelo vírus B(HBV), tem um risco maior que a hepatite A de desenvolver a hepatite crônica , que a longo prazo pode acarretar diversos problemas como cirrose, falência hepática e câncer hepático, esse risco aumenta ainda mais em pessoas com a idade mais avançada, alto consumo de álcool, tabagismo e imunossupressão.A hepatite B é transmitida habitualmente por contato sexual, transfusão sanguínea ou por agulhas contaminadas, podendo ocorrer até em tatuagens, piercings e acupuntura.
O maior problema da hepatite B é que 5 a 10% das pessoas nunca se curam pois desenvolvem a doença crônica, e outro fator que agrava mais a situação é que por nem sempre apresentarem sintomas, grande parte das pessoas desconhecem ter a infecção. Isso faz com que a doença possa evoluir por décadas sem o devido diagnóstico.Além disso por mais que a hepatite B possua esses riscos, atualmente existe a vacina e faz parte do calendário básico do Projeto Nacional de Imunização(PNI) oferecido pelo Sistema Único de Saúde(SUS), e portanto é de extrema importância essa vacinação desde criança.
A hepatite C, causada pelo vírus C(HCV), é a maior causa de doença crônica do fígado, sua transmissão ocorre por meio de compartilhamento de agulhas, objetos cortantes(podendo ser equipamentos médicos, tatuagem, piercing e até alicate de unha), além da transmissão na gestação da mãe para o filho. A grande tragédia da hepatite C é que seu vírus só foi reconhecido no início da década de 1990 e por mais que exista tratamento, até os dias atuais não existe uma vacina contra esse vírus, ou seja, ninguém está livre de contrair o vírus.
Além disso o maior problema da hepatite C é que como ela evolui muito facilmente para fase crônica e ela não costuma apresentar sintomas agressivos, a maior parte das pessoas desconhecem sua infecção e demoram para descobrir-la ,logo esse vírus permanece atacando o fígado da pessoa podendo evoluir para cirrose hepática, carcinoma hepatocelular (CHC), descompensação hepática, podendo ser fatal.
Por todas essas razões citadas as hepatites atacam o fígado muitas vezes silenciosamente, o que reitera a importância das pessoas tomarem os devidos cuidados e sempre estarem atentos à uma possível infecção, testes rápidos das doenças são oferecidos gratuitamento pelo SUS e se positivar a pessoa pode ser encaminhada para o tratamento, que também é oferecido gratuitamente pelo SUS, com medicamentos capazes de curar a infecção e impedir a progressão da doença.
O intuito do projeto será relizar análises a fim de responder certas perguntas relacionadas a Hepatite no Brasil, são elas:
- Qual a Hepatite Viral mais comum no Brasil atualmente?
- Qual a Hepatite que mais mata pessoas por ano?
- Qual a letalidade média de cada Hepatite?
- Quando começou a vacinação ampla contra a Hepatite B?
- Existe uma relação entre as doses aplicadas das vacinas contra a Hepatite B e as taxas de incidência e óbitos?
- Quando começou a vacinação ampla contra a Hepatite A?
- Existe uma relação entre as doses aplicadas da vacina contra a Hepatite A e as taxas de incidência e óbitos?
- Como se comporta a taxa de incidência, relativa à população, de cada Hepatite nos últimos anos?
- Como se comporta a taxa de óbitos, relativa à população, de cada Hepatite nos últimos anos?
- Qual região brasileira mais apresenta casos e óbitos de Hepatite por ano?
- Como se comporta a taxa de incidência, relativa à população, de cada Hepatite em cada região nos últimos anos?
- Como se comporta a taxa de óbitos, relativa à população, de cada Hepatite em cada região nos últimos anos?
- Qual região brasileira apresenta maior taxa de incidência e maior taxa de óbitos médias das Hepatites?
- Qual região brasileira apresenta maior taxa de incidência e maior taxa de óbitos médias para cada Hepatite?
Nesta pasta estão os arquivos relacionados aos dados brutos, esses consistem em 13 arquivos, 6 .csv e 7 .xls, obtidos de 3 fontes de dados, são eles:
- arquivo .csv obtido do DATASUS sobre os casos e óbitos de hepatite no Brasil todo:
casos_hepatite_2001-2006_brasil.csv : arquivo csv com dados de casos de Hepatite entre 2001 e 2006
- 3 arquivos .csv obtidos do DATASUS sobre os casos e óbitos de hepatite por região:
casos_hepA_por_regiao.csv : arquivo csv com os dados de casos e óbitos de hepatite A por região entre 2001 e 2006
casos_hepB_por_regiao.csv : arquivo csv com os dados de casos e óbitos de hepatite B por região entre 2001 e 2006
casos_hepC_por_regiao.csv : arquivo csv com os dados de casos e óbitos de hepatite C por região entre 2001 e 2006 - 2 arquivos .csv obtidos do DATASUS sobre cobertura de vacinação e doses aplicadas das vacinas contra hepatite B e hepatite A:
cobertura_vacina_hep.csv : dados relacionados à cobertura das vacinas contra hepatite B e hepatite A, a fórmula de cálculo da cobertura é o número de doses aplicadas da dose indicada (1ª, 2ª, 3ª dose ou dose única, conforme a vacina) dividida pela população alvo, multiplicado por 100
vacinas_hepatite.csv : dados relacionados aos totais de doses aplicadas das vacinas contra hepatite B e da vacina contra a hepatite A - arquivo .xls com dados de casos e óbitos de hepatite dos indicadores de Hepatite do governo no Brasil todo:
MonitoramentoHepatites-Brasil.xls : arquivo xls com diversas tabelas relacionados aos dados de casos e óbitos de hepatite no Brasil entre 2007 e 2019 - 5 arquivos .xls com dados de casos e óbitos dos indicadores de Hepatite do governo em cada região:
MonitoramentoHepatites-Norte.xls : arquivo xls com várias tabelas relacionadas aos casos e óbitos de Hepatites da região Norte entre 2007 e 2019
MonitoramentoHepatites-Nordeste.xls : arquivo xls com várias tabelas relacionadas aos casos e óbitos de hepatites da região Nordeste entre 2007 e 2019
MonitoramentoHepatites-Sul.xls : arquivo xls com várias tabelas relacionadas aos casos e óbitos de hepatites da região Sul entre 2007 e 2019
MonitoramentoHepatites-Sudeste.xls : arquivo xls com várias tabelas relacionadas aos casos e óbitos de hepatites da região Sudeste entre 2007 e 2019
MonitoramentoHepatites-Centro-Oeste.xls : arquivo xls com várias tabelas relacionadas aos casos e óbitos de hepatites da região Centro-Oeste entre 2007 e 2019 - arquivo .xls com estimativas populacionais realizadas pelo IBGE entre 2001 e 2020 por unidade federativa:
serie_2001_2020_TCU_populacao.xls : arquivo xls com dados com dados da estimativa da população brasileira feita pelo IBGE entre 2001 e 2020
Aqui se encontram os dados que foram tratados para realizar a análise final, esses dados se encontram em 3 arquivos .csv, são eles:
- casos_obitos_hep: dados sobre o número de casos e óbitos das hepatite A, B e C por ano, além disso com dados de taxas de incidência e de óbitos a cada 100 mil habitantes.
- casos_obitos_por_regiao: dados sobre o número de casos e óbitos das hepatites A, B e C por ano e por região, além disso com dados de taxas de incidência e de óbitos a cada 100 mil habitantes.
- vacinas_hep: dados sobre a cobertura de vacinação contra a hepatite A e B, e a soma das doses aplicadas das vacinas contra hepatite B(HB, pentavalente e hexavalente) e da vacina contra a hepatite A
Nesta pasta se encontram os notebooks desenvolvidos no jupyter, esses notebooks foram divididos em dois tipos, 3 deles destinados ao tratamento dos dados brutos:
- tratamento_casos_obitos_hep_brasil: notebook destinado a realizar todas as transformações necessárias nos conjuntos de dados relacionados aos casos e óbitos de hepatite no Brasil.
- tratamento_casos_por_regiao: notebook destinado a realizar todas as transformações necessárias nos conjuntos de dados relacionados aos casos e óbitos de hepatite no Brasil por região.
- tratamento_vacina: notebook destinado a realizar todas as transformações necessárias nos conjuntos de dados relacionados aos as vacinas contra as hepatites no Brasil.
O outro notebook foi destinado à análise dos dados e as visualizações:
- Analise_final: notebook destinado à análise dos dados de hepatite A, B e C
Além dos notebooks nessa pasta se encontra o arquivo requirements.txt , com a lista de todos os pacotes usados no projeto, afim de facilitar a reprodutibilidade.
Imagens:📊
Nessa pasta estão as imagens utilizadas no projeto, tanto no README e nos notebooks, e todos os gráficos criados no projeto.
Após a análise foi possível tirar diversas informação dos dados e criar algumas hipóteses, foram elas:
- O vírus HCV é a responsável pela maior quantidade de casos de hepatite desde 2008 no Brasil
- O vírus HAV da hepatite A vem baixando ao longo do tempo desde 2006 no Brasil, o que pode ser advindo de um investimento melhor em saneamento básico
- A hepatite C é a hepatite que mais matou no Brasil em todo o período de 2007 e 2018
- A hepatite C é a hepatite mais letal, em que 8,13% das pessoas infectadas morrem
- A vacina da hepatite B teve seu pico de imunização no final dos anos 1990 e início dos anos 2000
- No ano onde mais foram aplicadas doses de vacinas contra a Hepatite B foi o ano que a taxa de incidência por 100 mil habitantes obteve o menor valor entre 2001 e 2019
- A vacinação ampla da hepatite A começou a partir do ano de 2014, e os anos seguintes foram os anos onde menos se teve casos de infecção do vírus e menos teve mortes relacionadas a essa infecção
- A região Sul é a que apresentou maior média de casos(entre 2001 e 2019) e óbitos(entre 2007 e 2018) de hepatite
- A hepatite C teve a maior taxa de incidência na maior parte do período(entre 2001 e 2019) nas regiões Sul e Sudeste
- A hepatite C teve a maior taxa de incidência na maior parte do período(entre 2001 e 2019) nas regiões Norte e Nordeste
- A hepatite B teve a maior taxa de incidência na maior parte do período(entre 2001 e 2019) na região Centro-Oeste
- A hepatite C foi a que teve maior taxa de óbitos em todas as regiões em todo o período de 2007 até 2018
- A região Sul é a região que apresenta a maior taxa de incidência e de óbitos médios de todas as hepatites durante o período analisado
- A região Norte é a região que apresenta a maior taxa de incidência de hepatite A durante o período analisado
- A região Sul é a região que apresenta a maior taxa de óbitos de hepatite A, B e C durante o período analisado, tendo uma taxa de óbitos por hepatite C de 3,79 a cada 100 mil habitantes
- A região Sul é a região que apresenta a maior taxa de incidência de hepatite B e C durante o período analisado
Esse projeto foi realizado utilizando a lingaugem Python versão 3.7.6 através do jupyter lab versão 1.2.6, as bibliotecas usadas foram:
- Pandas versão 1.0.1 : biblioteca rápida e poderosa usada para manipulação de dados
- Matplotlib versão 3.1.3 : biblioteca usada para visualização de dados
- Seaborn versão 0.10.0 : biblioteca baseada no Matplotlib para visualização de gráficos estatísticos mais complexos
- Re versão 2.2.1 : biblioteca usada para manipulação de strings usando 'regular expressions'
- Para mais informações de todas as versões utilizadas para replicação do projeto acesse o requirements.txt
Queria agradecer a todos da alura, aos professores Thiago Gonçalves e Guilherme Silveira, a todo pessoal do discord do bootcamp de Data Science Aplicada e aos projetos dos outros alunos que todos eles ajudam a melhorar e dão diversas inspirações.
https://mundoeducacao.uol.com.br/biologia/figado.htm
https://hepatogastro.com.br/importancia-da-saude-do-figado/
https://www.tuasaude.com/funcao-do-figado/
https://brasilescola.uol.com.br/biologia/o-figado.htm
https://www.mdsaude.com/gastroenterologia/hepatites/
https://www.megaimagem.com.br/blog/hepatites-virais-causas-e-diagnosticos/
http://giv.org.br/Hepatites-Virais/Hepatite-C/index.html
http://www.aids.gov.br/pt-br/publico-geral/hv/o-que-sao-hepatites-virais
https://www.saude.pr.gov.br/Pagina/Hepatites-virais
https://www.gov.br/saude/pt-br/assuntos/noticias/sus-disponibiliza-18-vacinas-para-criancas-e-adolescentes
http://www.planassiste.mpu.mp.br/news/governo-inclui-vacina-contra-hepatite-a-no-calendario-do-sus
https://portalarquivos.saude.gov.br/campanhas/vivamaissus/hepatite_interna.html
https://www.scielo.br/j/sausoc/a/gn7vpPFZYBHq6s6JVtHCHbw/?lang=pt#
http://tabnet.datasus.gov.br/cgi/pni/Imun_cobertura_desde_1994.pdf
https://www.storytellingwithdata.com/
https://github.com/diascarolina/healthcare-analysis
https://jtemporal.com/requirements-txt/