{"id":23681357,"url":"https://github.com/esscova/data-science","last_synced_at":"2026-05-02T18:38:27.270Z","repository":{"id":260197695,"uuid":"860353573","full_name":"esscova/data-science","owner":"esscova","description":"Repositório com projetos e materiais de estudo em data science","archived":false,"fork":false,"pushed_at":"2025-01-03T11:04:51.000Z","size":7234,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-01-03T12:22:24.717Z","etag":null,"topics":["association-rules","classification","clustering","ml","python","regression","streamlit","time-series"],"latest_commit_sha":null,"homepage":"","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/esscova.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-09-20T09:23:13.000Z","updated_at":"2025-01-03T11:04:54.000Z","dependencies_parsed_at":null,"dependency_job_id":"d41793c1-7dcf-463c-960e-1eefd26b56af","html_url":"https://github.com/esscova/data-science","commit_stats":null,"previous_names":["esscova/data-science"],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/esscova%2Fdata-science","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/esscova%2Fdata-science/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/esscova%2Fdata-science/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/esscova%2Fdata-science/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/esscova","download_url":"https://codeload.github.com/esscova/data-science/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":239728166,"owners_count":19687311,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["association-rules","classification","clustering","ml","python","regression","streamlit","time-series"],"created_at":"2024-12-29T18:36:41.407Z","updated_at":"2026-01-02T23:30:16.956Z","avatar_url":"https://github.com/esscova.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Data Science Learning Repository\nEste repositório armazena meus estudos, experimentos e implementações de técnicas e algoritmos na área de Data Science. Cada projeto explora conceitos fundamentais de Machine Learning, organizados por técnicas como classificação, regressão e agrupamento, com notebooks, scripts e relatórios documentando o processo de aprendizado.\n\u003cp align='center'\u003e\n\t\u003cimg src='https://revistamarina.cl/storage/app/media/uploaded-files/figura-1-2.jpg' width=800/\u003e\n\u003c/p\u003e\n\n\n## Estrutura do Repositório\n\nAbaixo está a estrutura geral do repositório, organizada em categorias que representam os diferentes temas de aprendizado:\n\n```plaintext\n.\n├── association_rules                 # Regras de associação e análise de padrões frequentes\n├── classification                    # Projetos de classificação de dados\n│   ...\n├── clustering                        # Agrupamento e segmentação de dados\n│   ...\n├── datasets                          # Conjunto de dados utilizados nos projetos\n├── neural_networks                   # Implementações de redes neurais\n│   ├── classification                # Redes neurais para classificação\n│   └── regression                    # Redes neurais para regressão\n├── regression                        # Projetos de regressão\n│   ...\n├── shared_utils                      # Funções e utilidades compartilhadas\n├── study_materials                   # Material de estudo \n├── time_series                       # Projetos de séries temporais\n├── probabilistic                     # Projetos com modelagem probabilística\n└── LICENSE                           # Licença do repositório\n```\n\n---\n\n## Projetos\n\n### Classificação\n- [Classificação de Qualidade de Veículos](./classification/vehicle_classifier/)  \n  Este projeto apresenta uma aplicação de classificação de veículos, desenvolvida com Streamlit e utilizando o modelo de classificação Naive Bayes categórico. O objetivo é prever a categoria de um veículo com base em características fornecidas, explorando técnicas de pré-processamento e avaliação de modelos de machine learning.\n\n- [Classificador de Insuficiência Cardíaca](./classification/heart_failure/)  \n  Mas e o coração? tá bem? ou só lembra dele nas sofrências? Este projeto é um sistema de machine learning para prever a possibilidade de insuficiência cardíaca com base em apenas 11 características de um conjunto de dados real. Com um modelo preditivo preciso, é possível detectar e tratar esses casos de forma precoce, potencialmente salvando vidas.\n\n- [Classificador para Câncer de Mama](./classification/breast_cancer/)  \n  O câncer de mama é uma das principais causas de morte entre mulheres em todo o mundo. Com este projeto, exploramos como a ciência de dados pode revolucionar o diagnóstico, usando dados e modelos para a detecção precoce e o diagnóstico correto de câncer de mama.\n\n### Regressão\n- [Previsão de Custo Inicial para Abertura de Franquia](./regression/franquia/)  \n  Este projeto mostra na prática como o Streamlit pode ser usado para criar uma aplicação interativa de ciência de dados. Utilizando um modelo de Regressão Linear, a aplicação prevê o custo inicial de abrir uma franquia, levando em conta fatores como a frequência anual de operação.\n\n- [Preditor para Preço de Imóveis](./regression/boston_housing/)  \n  Neste projeto, aplicamos técnicas de aprendizado de máquina para prever o valor médio de imóveis com base em características socioeconômicas e estruturais, como o número de cômodos e a proporção de alunos por professor. Uma aplicação útil para decisões imobiliárias informadas.\n\n- [Previsão de Custos Médicos](./regression/medical_cost/)  \n  Este projeto visa prever os custos médicos, comparando diversos algoritmos e apresentando resultados detalhados em relatórios. A estrutura do projeto é organizada para facilitar a reprodução e análise dos resultados.\n\n### Agrupamento\n- [Segmentação de Grupos de Clientes](./clustering/mall_customers/)  \n  Para otimizar estratégias de marketing e decisões comerciais, este projeto analisa os hábitos de compra e características demográficas dos clientes de um shopping. O objetivo é criar perfis de clientes com comportamentos semelhantes, permitindo campanhas de marketing personalizadas e ações mais eficazes.\n\n### Regras de assossiação\n- [Sistema de recomendação](./association_rules/sistema_recomendacoes/)  \n  Este projeto apresenta uma aplicação para geração de regras de recomendação, desenvolvida com Streamlite utilizando o algoritmo Apriori para encontrar padrões em transações. O objetivo é permitir ao usuário carregar um conjunto de transações e, a partir disso, gerar e visualizar regras de associação.\n- [Padrões de compra dos consumidores de um supermercado](./association_rules/grocieres/)  \n  Este projeto aplica o algoritmo Apriori para analisar padrões de compra em um dataset de transações de um supermercado (Groceries). O objetivo é descobrir quais produtos são frequentemente comprados juntos, fornecendo insights para melhorar estratégias de vendas, otimizar o layout do estabelecimento e personalizar ofertas para os clientes, levando a uma experiência de compra mais eficiente e satisfatória.\n\n### Séries temporais\n- [Previsão de vendas de leite com séries temporais](./time_series/milk_sales/)  \n  Este projeto desenvolve uma aplicação de previsão de vendas de leite utilizando Streamlit e o modelo de séries temporais SARIMA. A aplicação permite que os usuários carreguem uma série temporal de dados históricos de vendas e, com base nessa informação, realizem previsões precisas para períodos futuros. Além disso, a aplicação fornece uma visão detalhada da decomposição e da projeção das vendas, permitindo que os usuários tomem decisões informadas sobre suas estratégias de negócios.\n\n### Modelagem probabilística\n- [Probabilidade de falhas em equipamentos](./probabilistic/failure_probabilities/)  \n  Explore a distribuição de falhas em equipamentos com Streamlit através da modelagem de Poisson, neste projeto é possível calcular probabilidades exatas, acumuladas e complementares, fornecendo insights valiosos sobre a confiabilidade do sistema. O projeto integra bibliotecas como NumPy, Matplotlib e SciPy para garantir precisão e eficiência nos cálculos.\n\n---\n\n## Conteúdos Adicionais\n\n- **datasets/**: Armazena datasets utilizados em múltiplos projetos.\n- **shared_utils/**: Funções e scripts auxiliares usados em diferentes projetos.\n- **study_materials/**: Materiais de estudo sobre algoritmos específicos e técnicas avançadas de machine learning.\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fesscova%2Fdata-science","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fesscova%2Fdata-science","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fesscova%2Fdata-science/lists"}