Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/jessicahora/analise_preditiva_diamond_price
Estudo de caso de Analise preditiva de preços de diamantes. Esse repositório contem estudo sobre Machine Learning e Redes Neurais.
https://github.com/jessicahora/analise_preditiva_diamond_price
Last synced: 7 days ago
JSON representation
Estudo de caso de Analise preditiva de preços de diamantes. Esse repositório contem estudo sobre Machine Learning e Redes Neurais.
- Host: GitHub
- URL: https://github.com/jessicahora/analise_preditiva_diamond_price
- Owner: JessicaHora
- Created: 2024-06-26T14:12:11.000Z (5 months ago)
- Default Branch: main
- Last Pushed: 2024-08-12T19:48:46.000Z (3 months ago)
- Last Synced: 2024-08-13T21:27:53.446Z (3 months ago)
- Language: Jupyter Notebook
- Homepage:
- Size: 5.27 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Analise Preditiva de Preços de diamantes
## Problema do Projeto a ser resolvido:
- Ser capaz de prever o preço que o mercado pagará pelos diamantes com precisão.
## Metadados dos dados:
- Número de atributos : 10
- Informações sobre o recurso : Um DataFrame com 53.940 linhas e 10 variáveis:- price: Preço em dólares americanos
- carat:Peso do diamante
- cut: Qualidade do corte (razoável, boa, muito boa, premium, ideal)
- color: Cor do diamante, de J (pior) a D (melhor)
- clarity: Uma medida de quão claro o diamante é (I1 (pior), SI2, SI1, VS2, VS1, VVS2, VVS1, IF (melhor))
- x: Comprimento em mm
- y: Largura em mm
- z: Profundidade em mm
- depth: Porcentagem de profundidade total = z / média(x, y) = 2 * z / (x + y)
- table: Largura do topo do diamante em relação ao ponto mais largo## Objetivos gerais do projeto:
- Construir um modelo preditivo que preveja o preço dos diamantes, com a maior precisão possível, com base nessas características.
- Prever os preços dos diamantes oferecidos pelos produtores, para que possa ser decidir quanto pagar por esses diamantes.
- construir um modelo de regressão tendo como alvo o preço do diamante .## Ferramentas Usadas
Este projeto foi desenvolvido usando Python,NumPy, pandas, matplotlib, Seaborn e scikit-learn, Keras, tensorflow.## Métricas para avaliação do modelo:
- Se as previsões estiverem próximas dos valores reais, isso é considerado bom.
- Por outro lado, se a previsão estiver muito distante do valor real, isso não é bom.## Resultados do EDA:
- À medida que os preços aumentam, observamos menos diamantes em nossa amostra.
- Há grande variabilidade nos preços dos diamantes; de fato, os preços variam de US$ 326 a US$ 18.823.
- Essa alta variabilidade dos preços se reflete em um desvio padrão de US$ 4.000.
- Devido à alta variabilidade de preços e à longa cauda da distribuição, não existe um preço típico para um diamante.
- Cerca de 25% dos preços estão abaixo de US$ 950 (aproximadamente).
- Para um diamante que não seja nem muito barato nem muito caro, a faixa de preço fica entre US$ 950 e US$ 5.300.
- Metade dos preços dos diamantes está abaixo de US$ 2.401.
- A distribuição de preços é enviesada para a direita e isso terá implicações para a modelagem.
## Resultado dos Modelos de ML:![image](https://github.com/JessicaHora/Analise_preditiva_diamond_price/blob/main/Modelo%20ML.png)
O Modelo KNN foi o melhor modelo pois tem o Melhor MSE( Erro quadrático Médio )
## Previsões e preços reais produzido pelos Modelos:
![image](https://github.com/JessicaHora/Analise_preditiva_diamond_price/blob/main/previsaodePrice.png)
## Redes Neurais:
Um Modelo de Redes Neurais- Os MLPs foi desenvolvido com o objetivo de resolver problemas de Análise preditiva, com o objetivo de obter um modelo mais preciso possível nas Previsões.
### Parâmetros utilizados:
- units:Este é o número de neurônios na camada, usei 32.
- activation:Esta é a função de ativação que será usada em cada um dos neurônios, foi utilizado o ReLU.
- input_shape: Este é o número de entradas que a rede receberá, que é igual ao número de recursos preditivos no conjunto de dados.O modelo atingiu uma acurácia de 93%