Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/felinjob/ibm-applied-data-science-capstone
Este projeto, parte da especialização IBM Data Science Professional Certificate, prevê o sucesso do pouso do Falcon 9 da SpaceX. Usando dados da API da SpaceX e Web Scraping, o projeto inclui análise de dados e Machine Learning para gerar insights sobre os lançamentos.
https://github.com/felinjob/ibm-applied-data-science-capstone
data-analysis data-science data-visualization ibm jupyter-notebook machine-learning numpy pandas python scikit-learn seaborn sql
Last synced: about 2 months ago
JSON representation
Este projeto, parte da especialização IBM Data Science Professional Certificate, prevê o sucesso do pouso do Falcon 9 da SpaceX. Usando dados da API da SpaceX e Web Scraping, o projeto inclui análise de dados e Machine Learning para gerar insights sobre os lançamentos.
- Host: GitHub
- URL: https://github.com/felinjob/ibm-applied-data-science-capstone
- Owner: felinjob
- Created: 2024-11-20T21:00:22.000Z (about 2 months ago)
- Default Branch: main
- Last Pushed: 2024-11-20T21:19:30.000Z (about 2 months ago)
- Last Synced: 2024-11-20T22:18:56.021Z (about 2 months ago)
- Topics: data-analysis, data-science, data-visualization, ibm, jupyter-notebook, machine-learning, numpy, pandas, python, scikit-learn, seaborn, sql
- Language: Jupyter Notebook
- Homepage:
- Size: 4.59 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Análise de Dados da SpaceX: Insights sobre o Pouso do Falcon 9
## Introdução
A SpaceX revolucionou a indústria espacial com seus foguetes Falcon 9, oferecendo lançamentos a preços muito competitivos (62 milhões de dólares), enquanto outras empresas cobram mais de 165 milhões de dólares. Essa diferença se deve à capacidade da SpaceX de reutilizar o primeiro estágio do foguete.
Neste projeto, vamos construir um modelo de Machine Learning para prever o sucesso do pouso do primeiro estágio do Falcon 9. Essa previsão é crucial para empresas que competem com a SpaceX, permitindo que elas estimem os custos de lançamento e façam ofertas mais competitivas.
## Contexto do Projeto
Este projeto final faz parte da especialização IBM Data Science Professional Certificate e aplica os conhecimentos adquiridos ao longo do curso. O objetivo é responder às seguintes perguntas:
* Como variáveis como massa da carga útil, local de lançamento, número de voos e órbitas afetam o sucesso do pouso do primeiro estágio?
* A taxa de pousos bem-sucedidos aumenta ao longo dos anos?
* Qual o melhor algoritmo para classificação binária neste caso?## Metodologia
1. **Coleta de Dados:**
* API da SpaceX
* Web Scraping da Wikipedia2. **Preparação dos Dados:**
* Filtragem
* Tratamento de valores ausentes
* Codificação One-Hot para classificação binária3. **Análise Exploratória de Dados (EDA):**
* Visualização
* SQL4. **Visualização Analítica Interativa:**
* Folium
* Plotly Dash5. **Análise Preditiva:**
* Construção, ajuste e avaliação de modelos de classificação## Estrutura do Repositório
* **data/:** Dados e scripts relacionados.
* **notebooks/:** Jupyter notebooks com a documentação do projeto.
* **scripts/:** Scripts em Python para processamento, visualização e modelagem.
* **dash_app/:** Código do aplicativo interativo Plotly Dash.## Resultados
O projeto construiu um modelo de Machine Learning capaz de prever o sucesso do pouso do primeiro estágio do Falcon 9 com alta precisão. O modelo de Árvore de Decisão obteve o melhor desempenho, com uma acurácia de 94,44%.
## Conclusão
Este projeto demonstra como a Ciência de Dados pode ser aplicada para gerar insights valiosos no setor espacial. As previsões geradas pelo modelo podem auxiliar empresas a tomar decisões estratégicas em relação aos custos de lançamento e à competitividade no mercado.