https://github.com/mcarneirobug/lab-exp-software
Projeto visa à mineração de dados em repositórios no github, com objetivo de obter dados a serem analisados testando hipóteses sobre os mesmos.
https://github.com/mcarneirobug/lab-exp-software
mineracaodedados puc-mg python
Last synced: 3 months ago
JSON representation
Projeto visa à mineração de dados em repositórios no github, com objetivo de obter dados a serem analisados testando hipóteses sobre os mesmos.
- Host: GitHub
- URL: https://github.com/mcarneirobug/lab-exp-software
- Owner: mcarneirobug
- Created: 2021-02-12T17:23:26.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2021-03-11T01:09:08.000Z (about 4 years ago)
- Last Synced: 2024-12-31T21:28:22.337Z (5 months ago)
- Topics: mineracaodedados, puc-mg, python
- Language: Python
- Homepage:
- Size: 679 KB
- Stars: 0
- Watchers: 1
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
Laboratório de Experimentação de Software



Tabela de conteúdos
=================* [Sobre o projeto](#page_facing_up-sobre-o-projeto)
* [Questões de pesquisa](#dart-questões-de-pesquisa)
* [Relatório final](#pencil-relatório-final)
* [Bônus](#white_check_mark-bônus)
* [Processo de desenvolvimento](#octocat-processo-de-desenvolvimento)
* [Alunos](#busts_in_silhouette-alunos)
* [Professor responsável](#bust_in_silhouette-professor-responsável)### :page_facing_up: Sobre o projeto
Neste laboratório, vamos estudar as principais características de sistemas populares open-source. Dessa forma, vamos analisar como eles são desenvolvidos, com que frequência recebem contribuição externa, com qual frequência lançam releases, entre outras características. Para tanto, colete os dados indicados a seguir para os 1.000 repositórios com maior número de estrelas no GitHub e discuta os valores obtidos.
### :dart: Questões de pesquisa
- RQ 01. Sistemas populares são maduros/antigos?
- Métrica: idade do repositório (calculado a partir da data de sua criação).- RQ 02. Sistemas populares recebem muita contribuição externa?
- Métrica: total de pull requests aceitas.- RQ 03. Sistemas populares lançam releases com frequência?
- Métrica: total de releases.- RQ 04. Sistemas populares são atualizados com frequência?
- Métrica: tempo até a última atualização (calculado a partir da data de última atualização).- RQ 05. Sistemas populares são escritos nas linguagens mais populares (Links para um site externo.)?
- Métrica: linguagem primária de cada um desses repositórios.- RQ 06. Sistemas populares possuem um alto percentual de issues fechadas?
- Métrica: razão entre número de issues fechadas pelo total de issues.### :pencil: Relatório final
Para cada uma questões de pesquisa anteriores, faça uma sumarização dos dados obtidos através de valores medianos (Links para um site externo.). Mesmo que de forma informal, elabore hipóteses sobre o que você espera de resposta e tente analisar a partir dos valores obtidos. Para valores de categoria (ex.: linguagem de programação), elabore uma contagem por categoria, para facilitar suas descobertas.
Elabore um documento que apresente (i) uma introdução simples com hipóteses informais; (ii) a metodologia que você utilizou para responder às questões de pesquisa; (iii) os resultados obtidos para cada uma delas; (iii) a discussão sobre o que você esperava como resultado (suas hipóteses) e os valores obtidos.
### :white_check_mark: Bônus
Divida os resultados obtidos nas RQs 02, 03 e 04 por linguagem e analise como esses valores se comportam de acordo com as linguagem de cada repositório. Ou seja, acrescente ao seu trabalho a seguinte questão:
RQ. 07: Sistemas escritos em linguagens mais populares recebem mais contribuição externa, lançam mais releases e são atualizados com mais frequência?
Dica: compare os resultados para os sistemas com as linguagens da reportagem com os resultados de sistemas em outras linguagens.
### :octocat: Processo de desenvolvimento
- [X] Lab01S01: Consulta graphql para 100 repositórios + requisição automática (**5 pontos**) - (Entrega: 23 fev)
- [X] Lab01S02: Paginação (consulta 1000 repositórios) + dados em arquivo .csv (**5 pontos**) - (Entrega: 02 mar)
- [X] Lab01S03: Análise de dados + elaboração do relatório final (**10 pontos**) (Entrega: 10 mar)
### :busts_in_silhouette: Alunos
- Matheus Santos Rosa Carneiro.
- Raíssa Carolina Vilela da Silva.
- Vitor Augusto Alves de Jesus.### :bust_in_silhouette: Professor responsável
- Jose Laerte Pires Xavier Junior.
🚧 Spring 3 🚀 finalizado ... 🚧