{"id":21524770,"url":"https://github.com/teomewhy/churn-sub","last_synced_at":"2025-04-09T23:10:09.750Z","repository":{"id":44928396,"uuid":"510731537","full_name":"TeoMeWhy/churn-sub","owner":"TeoMeWhy","description":"Repo para modelagem preditiva de churn de assinaturas da Gamers Club","archived":false,"fork":false,"pushed_at":"2022-08-03T11:46:42.000Z","size":36,"stargazers_count":29,"open_issues_count":2,"forks_count":39,"subscribers_count":3,"default_branch":"main","last_synced_at":"2025-04-09T23:10:02.387Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":null,"language":"Python","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/TeoMeWhy.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null}},"created_at":"2022-07-05T12:42:01.000Z","updated_at":"2024-08-16T02:37:10.000Z","dependencies_parsed_at":"2022-07-19T23:02:44.221Z","dependency_job_id":null,"html_url":"https://github.com/TeoMeWhy/churn-sub","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Fchurn-sub","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Fchurn-sub/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Fchurn-sub/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Fchurn-sub/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/TeoMeWhy","download_url":"https://codeload.github.com/TeoMeWhy/churn-sub/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":248125613,"owners_count":21051770,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2024-11-24T01:29:07.538Z","updated_at":"2025-04-09T23:10:09.728Z","avatar_url":"https://github.com/TeoMeWhy.png","language":"Python","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Churn Sub\n\nProjeto de Machine Learning para identificação de futuros players que cancelarão sua assinatua na Gamers Club.\n\nTodo desenvolvimento deste projeto será realizado durante as lives ([twitch.tv/teomewhy](https://www.twitch.tv/teomewhy)), utilizando o Databricks, plataforma Big Data amplamente utilizada no mercado de trabalho.\n\n## Motivação\n\nUma das fontes de receita da GC são as assinaturas de seus players. Com isso, quando há crescimento de churn (cancelamento), é um sinal de que a receita terá queda. Assim, ao identificar os possíveis players que deixarão de assinar, temos oportunidade de retê-los, podendo realizar promoções e adição de benefícios, bem como comunicação de quais funcionalidades ele pode passar a utilizar.\n\n## Dados\n\nUtilizaremos os dados fornecidos pela própria Gamers Club. Você pode baixar estes dados no Kaggle: [Brazilian CS:GO Platform Dataset by Gamers Club](https://www.kaggle.com/datasets/gamersclub/brazilian-csgo-plataform-dataset-by-gamers-club).\n\nPara os assinantes do canal da Twitch, os dados estarão disponíveis no Datalake.\n\n## Agenda\n\nNossas lives acontecem todas Terças e Quintas as 9:00AM, seguindo o seguinte calendário:\n\n|Encontro|Data|Tema|Link|\n|---|---|---|---|\n|1|12-07-22|Introdução e definição do problema| [:link:](https://www.twitch.tv/videos/1530063562) |\n|2|14-07-22|Definição das Features Store - Parte I | [:link:](https://www.twitch.tv/videos/1531592209) |\n|3|19-07-22|Definição das Features Store - Parte II | [:link:](https://www.twitch.tv/videos/1536356016) |\n|4|21-07-22|Variável resposta e ABT| [:link:](https://www.twitch.tv/videos/1538383113) |\n|5|26-07-22|SEMMA| [:link:](https://www.twitch.tv/videos/1543294104) |\n|6|28-07-22|Modelo final| [:link:](https://www.twitch.tv/videos/1545273986) |\n|7|02-08-22|Deploy com MLflow| [:link:](https://www.twitch.tv/videos/1551009420) |\n\nPara acessa a coleção completa dos vídeos, [clique aqui](https://www.twitch.tv/collections/-iVyOjw2ARc93A).\n\n### 1. Introdução e definição do problema\n\nAqui vamos definir qual é a problemática que vamos atuar. Dando um boa introdução de como funciona a Gamers Club e seus assinaturas.\nDesta forma o pessoal consegue entender melhor quais serão as oportunidades envolvidas.\n\n### 2. Definição das Features Store\n\nA partir dos dados, podemos identificar quais variáveis (atributos) podem fazer mais sentido para este estudo. A ideia é ao final deste encontro tenhamos as principais features preditoras do churn, em formato de Feature Store.\n\nFeature Store criadas:\n- [X] Assinatura\n- [X] Gameplay\n- [X] Medalha\n\n\n### 3. Variável resposta e ABT\n\nUma das etapas mais complicadas no processo de modelagem é a definição e construção da variável resposta, i.e., a variável (evento) que desejamos prever. Neste encontro teremos não só esta definição, mas sua construção e a tabela para o treinamento do nosso algoritmo.\n\n### 4. SEMMA\n\nAo organizarmos nosso mapa mental sobre o ciclo analítico, as coisas ficam mais fáceis de serem codificadas, isto é, tendo claro quais são os passos necessários a serem seguidos, podemos escrever um código mais limpo e claro. Para ajudar neste entendimento, vamos apresentar o conceito do SEMMA, desenvolvido pelo SAS Institute.\n\n### 5. Modelo Final\n\nApós ter treinado diversos algoritmos e testado diferentes métricas de performance, vamos decidir qual é o melhor algoritmo para explicar o evento de Churn de assinaturas na GC.\n\n### 6. Deploy\n\nPara gerr valor a partir dos dados, é necessário que outros usuários e sistemas possam consumir as informações geradas pelo modelo. Então buscamos realizar o deploy deste algoritmo em forma de Batch e/ou Real Time, seja usando agendadores ou APIs.\n\n## Sobre as lives\n\nTodas lives são abertas ao público em formato gratuito. Ao apoiar nossa iniciativa de ensino, você ganha alguns benefícios:\n\n- Acesso às gravações das lives\n- Acesso ao Databricks e aos dados\n- Dobro de pontos para resgate de prêmios ao assistir lives\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fteomewhy%2Fchurn-sub","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fteomewhy%2Fchurn-sub","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fteomewhy%2Fchurn-sub/lists"}