https://github.com/teomewhy/ds-bricks
Projeto de Data Science completo no Databricks
https://github.com/teomewhy/ds-bricks
Last synced: 11 months ago
JSON representation
Projeto de Data Science completo no Databricks
- Host: GitHub
- URL: https://github.com/teomewhy/ds-bricks
- Owner: TeoMeWhy
- License: gpl-3.0
- Created: 2024-07-23T13:23:04.000Z (almost 2 years ago)
- Default Branch: main
- Last Pushed: 2024-08-07T14:05:35.000Z (almost 2 years ago)
- Last Synced: 2025-07-20T22:37:41.580Z (12 months ago)
- Language: Python
- Size: 42 KB
- Stars: 35
- Watchers: 1
- Forks: 6
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Data Science completo no Databricks

Projeto de Data Science completo no Databricks utilizando suas principais funcionalidades para:
- Feature Store
- Gestão de Modelos
- Orquestração
- Linhagem de dados
Ao final, vamos integrar o modelo campeão ao nosso bot na Twitch!
## Sobre o curso
### Quando
A partir do dia 29/07/2024 às 9AM iniciaremos um projeto de Data Science completamente do início. As lives são aberta à todo público, disponível na [Twitch](https://twitch.tv/teomewhy) e [YouTube](https://youtube.com/@teomewhy).
[Clique aqui para adicionar na sua agenda!](https://calendar.google.com/calendar/event?action=TEMPLATE&tmeid=MWluMzQ5ZGhyZ2RuM2NuNDR0cjEyb2IyYmNfMjAyNDA3MjlUMTIwMDAwWiB0ZW9AdGVvbWV3aHkub3Jn&tmsrc=teo%40teomewhy.org&scp=ALL)
### Onde
- [Twitch](https://twitch.tv/teomewhy)
- [YouTube](https://youtube.com/@teomewhy)
### O que
Juntos definiremos o problema de negócio a ser resolvido, variáveis que podem nos ajudar a resolvê-lo, bem como a criação do modelo preditivo para tal.
Todo material estará disponível posteriormente para nossos [membros do YouTube](https://www.youtube.com/channel/UC-Xa9J9-B4jBOoBNIHkMMKA/join) e [Subs da Twitch](https://twitch.tv/teomewhy).
### Quais dados?
Os dados são proveninetes do nosso sistema de pontos que acontece na Twitch. Tais dados foram migrados para o datalake/lakehouse, onde construimos as camadas Bronze -> Silver -> Gold.
As principais tabelas que trabalharemso serão:
- `silver.upsell.cliente`
- `silver.upsell.transacoes`
- `silver.upsell.transacoes_produto`
- `silver.upsell.produto`
Quer se antecipar? Conheça mais sobre os dados [aqui](https://www.kaggle.com/datasets/teocalvo/teomewhy-loyalty-system).
### Requisitos
- Python
- SQL
- -Git/GitHub
Confira tudo isso e muito mais em nosso site. [teomewhy.org/courses](https://teomewhy.org/courses)
## Sobre o instrutor
Téo é um entusiasta do universo de dados, traz consigo uma rica jornada nas esferas de Data Science e Analytics. Como líder, destacou-se na condução estratégica de equipes, liderando pessoas e projetos de Advanced Analytics. Sua visão inovadora, não apenas transformou a cultura organizacional, mas também impulsionou a implementação de diversos projetos de dados, integrando de maneira eficiente áreas cruciais da empresa.
Além de suas realizações profissionais, Teo nutre uma paixão dedicada à democratização do conhecimento na área de dados e tecnologia. Por meio de sua iniciativa educacional, Téo Me Why, ele compartilha insights valiosos, promove treinamentos envolventes e disponibiliza material autoral, alcançando uma audiência global. Sua abordagem acessível e inspiradora tem impactado milhares de entusiastas, tornando o aprendizado sobre dados mais inclusivo e estimulante.