Skip to content

leg-ufpr/hackathon

Repository files navigation

Hackathon de Data Science

Organizadores

Descrição

Hackathon significa uma maratona de programação. Nestes eventos, programadores se reúnem com diversos outros profissionais, formando equipes, para competirem diante de um desafio que pode ser o desenvolvimento de um software ou a criação de soluções geralmente inovadoras, por exemplo.

Na Era da informação ou Big Data, o maior desafio é extrair conhecimento acionável (actionable knowledge) dos dados de forma automatizada e inteligente. Em big data, a velocidade, variedade e volume de dados impõem restrições de ordem física e operacional. A aquisição de conhecimento dos dados não apenas deve superar tais limitações mas produzir conhecimento útil não trivial, preferencialmente de forma automatizada, inteligente, integrada e fácil de usar para tomada de decisões. Devido a isso, os hackathons voltados para análise de dados ou produtos orientados por dados estão cada vez mais comuns. Nessa modalidade, programadores, engenheiros de software, cientistas da computação, estatísticos, cientistas de dados e profissionais de domínio específico do tema formam equipes inter e multidiciplinares devido a natureza hiperdimensional da informação.

Em Dezembro de 2017 aconteceu em Curitiba o BlueHack, um hackathon com foco em ciência de dados, o primeiro com a utilização de dados públicos. Os desafios do BlueHack foram sobre dados de saúde pública, disponibilizados pela Secretaria da Saúde do Paraná. O evento contou com patrocínio e apoio de diversas empresas e instituições ligadas ao universo de Data Science & Big Data como a CELEPAR, Unimed Paraná, Agência de Inovação UFPR e a Laura, para mencionar alguns.

A Laura é uma empresa especializada no desenvolvimento de sistemas dotados de computação cognitiva, ou seja, smart things. A Laura foi uma das apoiadoras do BlueHack e colabora com soluções para projetos de Smart Cities, tendo como principal foco a saúde pública.

Reconhecendo que o cientista de dados tem um papel central no processo de conversão de dados em conhecimento, a Laura decidiu incentivar a participação de alunos no Data Science Summit 2018 (DSS) que acontece em Curitiba nos dias 27 e 28 de Março no Centro de Eventos do Sistema FIEP. Para isso, ela disponibilizou vouchers para inscrição de estudantes.

O DSS é um evento para congregar profissionais que trabalham com grande volume de dados, gestores e decisores que precisam entender cenários complexos antes de definir ações operacionais, gestores municipais e profissionais responsáveis por implantar recursos de Indústria 4.0, Smart Cities e Smart Things. O objetivo do evento é trazer conteúdo na forma de experiências, sucessos e insucessos, com Data Science aplicada aos mais diversos setores.

O objetivo desse hackathon é reunir estudantes para uma competição de programação de ciência de dados. A premiação do hackathon serão os vouchers cordialmente patrocinados pela Laura.

Regulamento

Inscrições e avaliação

  • Podem se inscrever alunos de graduação e pós graduação.
  • As equipes para competir aos vouchers devem ser formadas por até 4 participantes.
  • Cada pessoa inscrita deve pagar a taxa de inscrição na importância de R$ 5,00 (cinco reais) que será integralmente usada para realização de dois intervalos para café (coffee breaks).
  • As equipes que desejarem participar mas sem concorrer aos vouchers podem ser formadas com qualquer número de integrantes e de qualquer nível de títulação.
  • As incrições podem ser feitas online pelo formulário disponível em: INSCRIÇÃO.
  • A taxa de inscrição deve ser paga para os mentores abaixo mencionados, na sala 232 do prédio de Ciências Exatas, Centro Politécnico - UFPR.
  • A inscrição da equipe só está completa após o pagamento da inscrição de todos os membros.
  • A premiação será para as duas equipes que ficarem nas duas primeiras posições considerando as equipes que concorreram aos vouchers.
  • A premiação será de dois vouchers para cara equipe independente do número de participantes.
  • A equipe terá que passar as informações dos participantes que irão para o DSS para o patrocinador realizar a inscrição.
  • Os premiados com os vouchers devem ter disponibilidade de comparecer ao evento em 75% das atividades. O não atendimento desse requisito implica no ressarcimento do valor do voucher para o patrocinador.
  • A equipe deve desenvolver todo o projeto com dados fornecidos, podendo complementar com dados de outras fontes também públicas, e código abertos.
  • Os projetos devem ser submetidos via pull request para o repositório do hackathon. Os mentores irão descrever e auxiliar nesse processo.
  • O projeto pode conter arquivos como, mas não se limitando a estes:
    • Script R/Python, relatórios R/Python Markdown ou Jupyter Notebook.
    • Relatório em PDF ou HTML, na forma de relatório ou slides.
    • Todo o projeto deve estar aberto e reproduzível.
  • O projeto, após submissão, será validado pelos mentores:
    • Walmes Marques Zeviani (LEG/DEST/UFPR).
    • Wagner Hugo Bonat (LEG/DEST/UFPR).
  • Os projetos serão avaliados por uma banca de três jurados. Os jurados serão divulgados apenas no momento da avaliação dos trabalhos.
    • Convidado 1.
    • Convidado 2.
    • Convidado 3.
  • Os critérios de avaliação irão considerar os seguintes aspectos principais:
    • A qualidade da problematização.
    • A reprodutibilidade e clareza da escrita do código.
    • O grau de adequação ou pertinência da metodologia ou solução aplicada.
    • A qualidade da apresentação oral do projeto e o cumprimento do tempo disponível para fazê-lo.
    • A criatividade do projeto.
  • As equipes serão ordenadas de forma decrescente com relação a pontuação total obtida das fichas de avaliação dos jurados.
  • São motivos para a desclassificação:
    • Ter atraso superior à 30 minutos da abertura do hackathon.
    • Eviar código não reproduzível.
    • Não contribuir com a taxa de inscrição.
    • Plagiar o projeto de outra equipe.

Dados

  • Os dados serão disponibilizados via arquivos texto (CSV ou JSON) no repositório do hackathon.
  • O dicionário das variáveis será disponibilizado em markdown para ser acessado direto do repositório.

Infraestrutura

  • O espaço coletivo será o Laboratório de Estatística e Geoinformação que fica na sala 232 do prédio do Setor de Ciências Exatas.
  • A sala 201 será o espaço privado para realização de reuniões de até 20 minutos por equiope.
  • As salas 202 (apoio acadêmico) e de monitoria podem ser usadas em caso de necessidade.
  • Todos os dados e informações necessárias serão disponibilizados no pepositório do hackathon: https://github.com/leg-ufpr/hackathon.
  • No LEG será disponibilizado acesso a rede Wifi, além de acesso a rede eduroam e ufpr sem fio. Ambas exijem credenciais que alunos da UFPR possuem.
  • Os mentores do evento prestarão apoio técnico para as equipes.
    • Prof. Dr. Walmes Marques Zeviani (DEST/UFPR, organizador).
    • prof. Dr. Wagner Hugo Bonat (DEST/UFPR, co-organizador).
    • Convidado 4.

Cronograma de atividades

As atividades seguirão o seguite cronograma:

  • 15/03 19h00: fim do prazo para inscrição das equipes por meio do formulário online. O pagamento da inscrição deve ser feito para algum dos mentores dentro do mesmo período.
  • 16/03 19h00: disponibilização do dicionário das variáveis, dimensão dos dados e amostra para prototipação de importação dos dados.
  • 17/03
    • 08h00: sessão de abertura do hackathon.
    • 08h15: início da competição.
    • 08h30: fim do período de tolerância para atraso.
    • 10h30: coffee break.
    • 12h30: almoço.
    • 15h30: coffee break.
    • 17h00: fim do período para submissão do código.
    • 17h05: início da inspeção do código.
    • 17h30: início das apresentações.
    • 18h00: premiação.