{"id":21524747,"url":"https://github.com/teomewhy/tse-analytics","last_synced_at":"2025-04-09T23:09:46.062Z","repository":{"id":58810585,"uuid":"532891487","full_name":"TeoMeWhy/tse-analytics","owner":"TeoMeWhy","description":"Análise dos candidatos das eleições brasileiras de 2022","archived":false,"fork":false,"pushed_at":"2022-09-27T12:41:48.000Z","size":55,"stargazers_count":40,"open_issues_count":0,"forks_count":4,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-04-09T23:09:35.690Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":"","language":"Python","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/TeoMeWhy.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null}},"created_at":"2022-09-05T12:29:40.000Z","updated_at":"2024-09-04T13:09:27.000Z","dependencies_parsed_at":"2023-01-18T20:31:05.053Z","dependency_job_id":null,"html_url":"https://github.com/TeoMeWhy/tse-analytics","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Ftse-analytics","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Ftse-analytics/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Ftse-analytics/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/TeoMeWhy%2Ftse-analytics/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/TeoMeWhy","download_url":"https://codeload.github.com/TeoMeWhy/tse-analytics/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":248125618,"owners_count":21051770,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2024-11-24T01:28:55.649Z","updated_at":"2025-04-09T23:09:46.020Z","avatar_url":"https://github.com/TeoMeWhy.png","language":"Python","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Análise dos partidos e candidatos para Eleições de 2022\n\nDados coletados a partir do site do TSE: [dadosabertos.tse.jus.br/dataset/candidatos-2022](https://dadosabertos.tse.jus.br/dataset/candidatos-2022), armazenados e analisados durante as lives no canal [Téo Me Why](https://www.twitch.tv/teomewhy).\n\nSegue os VODs para acompanhar o desenvolvimento:\n\n| Dia | Descrição| Link |\n|---|---|---|\n|2022-09-05| Análise de Bens e Clusters de Diversidade dos partidos |[:link:](https://www.twitch.tv/videos/1583439007) |\n|2022-09-07| Correções nas médias de taxas para a taxa geral. Mudança de representação gráfica. Novas bases adicionadas |[:link:]([https://www.twitch.tv/videos/1583439007](https://www.twitch.tv/videos/1584667854)) |\n\n## Índice\n\n- [1. ETL](#1-etl)\n- [2. Análises](#2-análises)\n    - [2.1. Bens Declarados](#21-bens-declarados)\n    - [2.2. Clusters em Diversidade](#22-clusters-em-diversidade)\n\n## 1. ETL\n\nAntes de nos debruçarmos diretamente em gráficos e análises, precisamos realizar o ETL (Extract Transform and Load), isto é, consultar os dados brutos e realizar os devidos filtros, cruzamentos e agregações. \nDesta maneira, como nosso intuito é realizar no primeiro momento uma análise voltada aos partidos, vamos agregar todas as informações dos candidatos por seus respectivos partidos.\n\nSegue abaixo as estatísticas criadas a partir dos dados brutos:\n\n|Nome Variável|Descrição|\n|---|---|\n| QTD_CANDIDATOS | Quantidade de candidatos no partido|\n| PCT_MASCULINO | Percentual de candidatos do gênero masculino no partido|\n| PCT_FEMININO | Percentual de candidatas do gênero feminino no partido|\n| PCT_LE_ESCREVE | Percentual de candidatos que tem como \"Sabe ler e escrever\" como Grau de Instrução no partido |\n| PCT_FUNDAMENTAL_INCOMPLETO | Percentual de candidatos que tem como \"Ensino Fundamental Incompleto\" como Grau de Instrução no partido |\n| PCT_FUNDAMENTAL_COMPLETO | Percentual de candidatos que tem como \"Ensino Fundamental Completo\" como Grau de Instrução no partido |\n| PCT_MEDIO_INCOMPLETO | Percentual de candidatos que tem como \"Ensino Médio Incompleto\" como Grau de Instrução no partido |\n| PCT_MEDIO_COMPLETO | Percentual de candidatos que tem como \"Ensino Médio Completo\" como Grau de Instrução no partido |\n| PCT_SUPERIOR_INCOMPLETO | Percentual de candidatos que tem como \"Ensino Superior Incompleto\" como Grau de Instrução no partido |\n| PCT_SUPERIOR_COMPLETO | Percentual de candidatos que tem como \"Ensino Superior Completo\" como Grau de Instrução no partido |\n| PCT_SOLTEIRO | Percentual de solteiros no partido |\n| PCT_CASADO | Percentual de casados no partido |\n| PCT_SEPARADO_JUDICIALMENTE | Percentual de Separados Judicialmente no partido|\n| PCT_DIVORCIADO | Percendual de Divorciados no partido |\n| PCT_VIUVO | Percentual de Viúvos no partido|\n| PCT_AMARELA | Percentual de \"cor e raça\" amarela no partido|\n| PCT_BRANCA | Percentual de \"cor e raça\" branca no partido|\n| PCT_INDiGENA | Percentual de \"cor e raça\" indígena no partido|\n| PCT_PARDA | Percentual de \"cor e raça\" parda no partido|\n| PCT_PRETA | Percentual de \"cor e raça\" preta no partido|\n| AVG_IDADE | Média de idade no partido|\n| VL_TOTAL_BEM_PARTIDO |Valor total declarado em bens dos candidatos do partido|\n| AVG_BEM_CANDIDATO |Valor médio declarado por candidato do partido|\n| MEDIAN_BEM_CANDIDATO |Valor mediano declarado por candidato do partido|\n| MAX_BEM_CANDIDATO |Valor mais alto declarado do partido |\n\nTodos estes dados foram criados e persistidos na tabela `silver_tse.sumario_partido` e seu script pode ser encontrado em `etl_sumario_partido.sql`.\n\n## 2. Análises\n\n## 2.1. Bens declarados\n\nDe maneira trivial, podemos gerar um (ou dois) gráficos bem simples para entender o comportamento dos partidos em relação à declaração de bens. isto é, calcular a **média** (AVG_BEM_CANDIDATO) e **mediana** (MEDIAN_BEM_CANDIDATO) por partido. Para média:\n\n\u003cimg src=\"https://i.ibb.co/sFK2cWH/grupos-partidos-media-bens.jpg\" alt=\"grupos-partidos-media-bens\" width=\"750\"\u003e\n\nAgora para a mediana (menos sensível à dados afastados da média):\n\n\u003cimg src=\"https://i.ibb.co/w06Rkpf/grupos-partidos-mediana-bens.jpg\" alt=\"grupos-partidos-mediana-bens\" width=\"750\"\u003e\n\nInteressante como a ordem dos partidos no gráfico se altera quando utilizamos uma medida menos sensível à outliers.\n\n## 2.2. Clusters em Diversidade\n\nA partir da tabela criada anteriormente, dá-se início às análises. Com isso, a primeira ideia seria realizar agrupameneto entre os 33 partidos encontrados, buscando classificar partidos similares entre si em um mesmo grupo.\n\nUtilizando as variáveis `PCT_FEMININO` e `PCT_PRETA`, aplicou-se o método de KMeans considerando 6 grupos. O resultado desta análise se dá pelo gráfico abaixo:\n\n\u003cimg src=\"https://i.ibb.co/nfYjwWQ/grupos-partidos-diversidade.jpg\" alt=\"grupos-partidos-diversidade\" width=\"750\"\u003e\n\nAdicionamos também uma visão que considera o tamanho do partido, i.e., a quantidade de candidatos que este partido tem para essas eleições. O tamanho de cada bolha, diz a respeito da quantidade de candidatos presentes no partido:\n\n\u003cimg src=\"https://i.ibb.co/mbb7kph/grupos-partidos-diversidade-tamanho.jpg\" alt=\"grupos-partidos-diversidade-tamanho\" width=\"750\"\u003e\n\nPor fim, a mesma de forma análoga à quantidade de candidatos, realizamos para o valor mediano de bens em cada partido, onde este número reflete no tamanho de sua bolha.\n\n\u003cimg src=\"https://i.ibb.co/MS2X8F0/grupos-partidos-diversidade-bens.jpg\" alt=\"grupos-partidos-diversidade-bens\" width=\"750\"\u003e\n\nO que se pode interpretar deste agrupamento? Vamos tentar responder abaixo.\n\n| Partidos | Resumo |\n|---|---|\n| REPUBLICANOS, PSDB, UNIÃO, PL, PRTB, PV, PTB, PSD, NOVO, PP, PODE  | Grupo que possui menor diversidade, tanto em gênero quanto em raça e cor.|\n| PROS, CIDADANIA, DC, PMB, PSB, PMN, SOLIDARIEDADE, MDB, PDT, PSC, REDE, AGIR, PATRIOTA, AVANTE | Grupo que contém maior número de partidos. Possui proporções de mulheres na média, bem como tambem na média da proporção de raça preta.|\n|PCO, PCB, PT| Grupo concentrado um pouco acima da proporção de raça preta geral, mas na média da proporção de mulheres geral |\n|PC do B|Grupo com um único partido, possui uma proporção de mulheres mais elevada, bem como de raça preta, se destacando dos demais|\n|PSOL, PSTU|Um dos menores grupos, com apenas 2 partidos, estes que apresentam a maior proporção de raça preta..|\n|UP|Grupo com apenas um partido, pois este se destaca nitidamente por altas proporções de mulheres e raça preta, sendo o único que possui mais mulheres que homens em seu partido.|\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fteomewhy%2Ftse-analytics","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fteomewhy%2Ftse-analytics","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fteomewhy%2Ftse-analytics/lists"}