- Sobre o projeto
- Questões de pesquisa
- Relatório final
- Bônus
- Processo de desenvolvimento
- Alunos
- Professor responsável
Neste laboratório, vamos estudar as principais características de sistemas populares open-source. Dessa forma, vamos analisar como eles são desenvolvidos, com que frequência recebem contribuição externa, com qual frequência lançam releases, entre outras características. Para tanto, colete os dados indicados a seguir para os 1.000 repositórios com maior número de estrelas no GitHub e discuta os valores obtidos.
-
RQ 01. Sistemas populares são maduros/antigos?
- Métrica: idade do repositório (calculado a partir da data de sua criação).
-
RQ 02. Sistemas populares recebem muita contribuição externa?
- Métrica: total de pull requests aceitas.
-
RQ 03. Sistemas populares lançam releases com frequência?
- Métrica: total de releases.
-
RQ 04. Sistemas populares são atualizados com frequência?
- Métrica: tempo até a última atualização (calculado a partir da data de última atualização).
-
RQ 05. Sistemas populares são escritos nas linguagens mais populares (Links para um site externo.)?
- Métrica: linguagem primária de cada um desses repositórios.
-
RQ 06. Sistemas populares possuem um alto percentual de issues fechadas?
- Métrica: razão entre número de issues fechadas pelo total de issues.
Para cada uma questões de pesquisa anteriores, faça uma sumarização dos dados obtidos através de valores medianos (Links para um site externo.). Mesmo que de forma informal, elabore hipóteses sobre o que você espera de resposta e tente analisar a partir dos valores obtidos. Para valores de categoria (ex.: linguagem de programação), elabore uma contagem por categoria, para facilitar suas descobertas.
Elabore um documento que apresente (i) uma introdução simples com hipóteses informais; (ii) a metodologia que você utilizou para responder às questões de pesquisa; (iii) os resultados obtidos para cada uma delas; (iii) a discussão sobre o que você esperava como resultado (suas hipóteses) e os valores obtidos.
Divida os resultados obtidos nas RQs 02, 03 e 04 por linguagem e analise como esses valores se comportam de acordo com as linguagem de cada repositório. Ou seja, acrescente ao seu trabalho a seguinte questão:
RQ. 07: Sistemas escritos em linguagens mais populares recebem mais contribuição externa, lançam mais releases e são atualizados com mais frequência?
Dica: compare os resultados para os sistemas com as linguagens da reportagem com os resultados de sistemas em outras linguagens.
-
Lab01S01: Consulta graphql para 100 repositórios + requisição automática (5 pontos) - (Entrega: 23 fev)
-
Lab01S02: Paginação (consulta 1000 repositórios) + dados em arquivo .csv (5 pontos) - (Entrega: 02 mar)
-
Lab01S03: Análise de dados + elaboração do relatório final (10 pontos) (Entrega: 10 mar)
- Matheus Santos Rosa Carneiro.
- Raíssa Carolina Vilela da Silva.
- Vitor Augusto Alves de Jesus.
- Jose Laerte Pires Xavier Junior.