{"id":22446941,"url":"https://github.com/albertofaraujo/sql_eda_exercito2022","last_synced_at":"2025-09-09T01:41:22.077Z","repository":{"id":235619760,"uuid":"791005845","full_name":"AlbertoFAraujo/SQL_EDA_exercito2022","owner":"AlbertoFAraujo","description":"O objetivo desta análise exploratória é examinar e compreender as características demográficas e físicas dos cidadãos brasileiros alistados no Serviço Militar Obrigatório do ano de 2022","archived":false,"fork":false,"pushed_at":"2024-04-24T00:54:56.000Z","size":11,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-07-14T08:20:32.212Z","etag":null,"topics":["apache-spark","data-science","databricks","eda","sql"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/AlbertoFAraujo.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null}},"created_at":"2024-04-23T23:30:05.000Z","updated_at":"2024-04-24T16:41:17.000Z","dependencies_parsed_at":"2024-04-24T01:55:22.915Z","dependency_job_id":"852dff76-ab3f-4994-8f0e-29ec9e6ae82a","html_url":"https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022","commit_stats":null,"previous_names":["albertofaraujo/sql_eda_exercito2022"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/AlbertoFAraujo/SQL_EDA_exercito2022","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_exercito2022","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_exercito2022/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_exercito2022/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_exercito2022/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/AlbertoFAraujo","download_url":"https://codeload.github.com/AlbertoFAraujo/SQL_EDA_exercito2022/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_exercito2022/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":274232035,"owners_count":25245856,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","status":"online","status_checked_at":"2025-09-08T02:00:09.813Z","response_time":121,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["apache-spark","data-science","databricks","eda","sql"],"created_at":"2024-12-06T04:13:07.476Z","updated_at":"2025-09-09T01:41:22.043Z","avatar_url":"https://github.com/AlbertoFAraujo.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/36c8a279-b478-40be-a2f0-4a49ca4f6a5a)\n\n### Tecnologias utilizadas: \n| [\u003cimg align=\"center\" alt=\"sql\" height=\"60\" width=\"60\" src=\"https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/805dfaf3-4725-47f9-86d5-241953a018ab\"\u003e](https://learn.microsoft.com/en-us/sql/sql-server/?view=sql-server-ver16) | [\u003cimg align=\"center\" alt=\"databrick\" height=\"60\" width=\"60\" src=\"https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/b188ba83-b87f-4f80-b79f-e91be05602af\"\u003e](https://www.databricks.com/) | [\u003cimg align=\"center\" alt=\"apache_spark\" height=\"60\" width=\"100\" src=\"https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/4b3cbec3-98da-499b-9d83-908ce9458d29\"\u003e](https://spark.apache.org/docs/latest/)|\n|:---:|:---:|:---:|\n| SQL | Databrick  | Apache Spark |\n\n- **SQL**: Linguagem padrão para consulta e manipulação de bancos de dados relacionais, permitindo operações como consulta, inserção, atualização e exclusão de dados.\n- **Databricks**: Plataforma de análise de dados e aprendizado de máquina baseada no Apache Spark, oferecendo um ambiente unificado para processamento em larga escala e desenvolvimento colaborativo.\n- **Apache Spark**: Framework open-source para processamento de big data, oferecendo uma API unificada para operações distribuídas em dados, com suporte a várias linguagens e módulos para processamento de streaming e machine learning.\n\u003chr\u003e\n\n### Sobre a base de Dados\n\nDados dos cidadãos brasileiros residentes no Brasil e no exterior que se alistaram no Serviço Militar Obrigatório de 2022 e relação das Juntas de Serviço Militar (JSM). Estão incluídas em todas as tabelas de dados do Serviço Militar as seguintes informações: ano de nascimento, peso, altura, tamanho da cabeça, número do calçado, tamanho da cintura, religião, município, UF e país de nascimento, estado civil, sexo, escolaridade, ano de alistamento, se foi dispensado ou não, zona residencial, município, UF e país de residência, junta, município e UF da junta. Estão incluídas na tabela de dados das JSM as seguintes informações: código, nome, endereço, bairro, CEP, telefone, município e UF.\n\n**Fonte:** https://dados.gov.br/dados/conjuntos-dados/servico-militar\n\n\u003chr\u003e\n\n### Objetivo: \n\nO objetivo desta análise exploratória é examinar e compreender as características demográficas e físicas dos cidadãos brasileiros alistados no Serviço Militar Obrigatório do ano de 2022. Por meio da análise dos dados disponíveis, buscamos identificar padrões, tendências e insights relevantes relacionados à distribuição de idade, gênero, região geográfica, estado civil, dispensa militar, educação, entre outras variáveis. Este estudo visa fornecer uma visão abrangente do perfil dos alistados, contribuindo para uma melhor compreensão do contexto socioeconômico e demográfico das pessoas sujeitas ao serviço militar obrigatório no Brasil.\n\n\u003chr\u003e\n\n### Script SQL\n```SQL\n-- Visualizando a base de dados para conhecimento das variáveis\nSELECT * FROM alistamento_exercito2022 LIMIT 10\n```\n| ANO_NASCIMENTO | PESO | ALTURA | CABECA | CALCADO | CINTURA | MUN_NASCIMENTO | UF_NASCIMENTO |\n|----------------|------|--------|--------|---------|---------|----------------|---------------|\n| 1960           | 69   | 176    | 56     | 42      | null    | RIO DE JANEIRO | RJ            |\n| 1995           | 79   | 181    | 56     | 41      | 88      | PALMEIRA DAS MISSOES | RS     |\n| 1974           | 64   | 165    | 58     | 38      | 75      | PORTO ALEGRE   | RS            |\n| 1998           | 55   | 180    | 53     | 41      | 74      | JANDIRA        | SP            |\n| 1999           | 76   | 186    | 57     | 42      | 88      | CACERES        | MT            |\n| 2000           | 76   | 184    | 58     | 42      | 78      | BRASILIA       | DF            |\n| 2000           | 60   | 165    | 53     | 40      | 71      | OLINDA         | PE            |\n| 2000           | 98   | 184    | 56     | 45      | 90      | OLINDA         | PE            |\n| 2003           | 78   | 175    | 58     | 42      | 87      | BRASILIA       | DF            |\n| 2003           | 80   | 170    | 54     | 40      | 79      | FORTALEZA      | CE            |\n\n```SQL\n-- Visualizando a base de dados para conhecimento das variáveis\nSELECT * FROM estados_brasileiro\n```\n| Estado          | Sigla | Região     |\n|----------------|-------|------------|\n| Rondônia       | RO    | Norte      |\n| Sergipe        | SE    | Nordeste   |\n| Minas Gerais   | MG    | Sudeste    |\n| Bahia          | BA    | Nordeste   |\n| Mato Grosso    | MT    | Centro     |\n| Rio de Janeiro | RJ    | Sudeste    |\n| Paraná         | PR    | Sul        |\n| Roraima        | RR    | Norte      |\n| Ceará          | CE    | Nordeste   |\n| Paraíba        | PB    | Nordeste   |\n\n```SQL\n-- Calculando o número total de alistados em 2022.\nSELECT \n  count(*) AS Total_alistados\nFROM alistamento_exercito2022\n```\n| Total_alistados |\n|-----------------|\n|      1020927    |\n\n```SQL\n-- Qual a distribuição de alistados por gênero? e o percentual?\nSELECT\n  EXE.SEXO AS Sexo,\n  count(*) AS Total,\n  format_number(count(*)/(SELECT count(*) FROM alistamento_exercito2022),\"0.000%\") AS Percentual\nFROM alistamento_exercito2022 AS EXE\nGROUP BY EXE.SEXO\n```\n\n| Sexo | Total   | Percentual |\n|------|---------|------------|\n| F    | 79      | 0.008%     |\n| M    | 1020848 | 99.992%    |\n\nFigura 1: Quantidade por Gênero\n\n![newplot (2)](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/7c0a7d21-f2e0-4137-894b-1f135d7c3513)\n\n```SQL\n-- Distribuição de alistados por gênero x Região e total por região\nSELECT \n    COALESCE(EST.`Região`, 'Exterior') AS Regiao,\n    SUM(CASE WHEN EXE.SEXO = \"F\" THEN 1 ELSE 0 END) AS Feminino,\n    format_number(SUM(CASE WHEN EXE.SEXO = \"F\" THEN 1 ELSE 0 END)/(SELECT count(*) FROM alistamento_exercito2022 WHERE SEXO = \"F\"),\"0.00%\") AS Percent_feminino,\n    SUM(CASE WHEN EXE.SEXO = \"M\" THEN 1 ELSE 0 END) AS Masculino,\n    format_number(SUM(CASE WHEN EXE.SEXO = \"M\" THEN 1 ELSE 0 END)/(SELECT count(*) FROM alistamento_exercito2022 WHERE SEXO = \"M\"),\"0.00%\") AS Percent_masculino,\n    count(*) AS Total,\n    format_number(count(*)/(SELECT COUNT(*) FROM alistamento_exercito2022),\"0.00%\") AS Percent_total\nFROM alistamento_exercito2022 EXE\nLEFT JOIN estados_brasileiro EST\nON EXE.UF_RESIDENCIA = EST.Sigla\nGROUP BY EST.`Região`\nORDER BY Masculino DESC, Feminino DESC\n```\n\n| Regiao    | Feminino | Percent_feminino | Masculino | Percent_masculino | Total   | Percent_total |\n|-----------|----------|------------------|-----------|-------------------|---------|---------------|\n| Sudeste   | 23       | 29.11%           | 457822    | 44.85%            | 457845  | 44.85%        |\n| Nordeste  | 29       | 36.71%           | 220340    | 21.58%            | 220369  | 21.59%        |\n| Sul       | 17       | 21.52%           | 138259    | 13.54%            | 138276  | 13.54%        |\n| Norte     | 4        | 5.06%            | 119888    | 11.74%            | 119892  | 11.74%        |\n| Centro    | 6        | 7.59%            | 77140     | 7.56%             | 77146   | 7.56%         |\n| Exterior  | 0        | 0.00%            | 7399      | 0.72%             | 7399    | 0.72%         |\n\nFigura 2: Gênero x Região\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/81acc877-c230-4fe5-a9fd-7c95e862609b)\n\nFigura 3: Total por Região \n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/97f1f336-b335-4852-a081-072e4de8561d)\n\nFigura 4: Gênero Feminino x Região\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/4e1c9466-632f-422c-a265-ac0823d5b7ce)\n\nFigura 5: Gênero Masculino x Região\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/5d369589-a6d7-4613-8eb6-6239760785bd)\n\n```SQL\n-- Top 5 estados com maiores alistados no ano de 2022\nSELECT\n  EST.Estado AS Estados,\n  count(*) AS Total,\n  format_number(count(*)/(SELECT count(*) FROM alistamento_exercito2022),\"0.00%\") AS Percent_total\nFROM alistamento_exercito2022 EXE\nLEFT JOIN estados_brasileiro EST\nON EXE.UF_RESIDENCIA = EST.Sigla\nGROUP BY EST.Estado\nORDER BY Total DESC\nLIMIT 5 \n```\n\nFigura 6: Top 5 estados x Gênero Masculino\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/fae36237-1a66-41bd-99dd-20b0caeddf67)\n\n```SQL\n-- Quantos alistados da região Norte estão acima ou igual a média do número de calçado do brasileiro?\n\nWITH media_calcado AS (SELECT avg(EXE.CALCADO) AS media_calcados FROM alistamento_exercito2022 EXE) --Calculando a média do calçado\n\nSELECT \n    EST.`Região` AS Regiao,\n    count(*) AS Total,\n    format_number(count(*)/(SELECT COUNT(*) FROM alistamento_exercito2022 EXE INNER JOIN estados_brasileiro EST ON EXE.UF_RESIDENCIA = EST.Sigla WHERE EST.`Região` = 'Nordeste'),\"0.00%\") AS Percent_total\nFROM alistamento_exercito2022 EXE\nLEFT JOIN estados_brasileiro EST\nON EXE.UF_RESIDENCIA = EST.Sigla\nCROSS JOIN media_calcado\nWHERE EXE.CALCADO \u003e= media_calcados AND EST.`Região` = 'Nordeste'\nGROUP BY EST.`Região`\n```\n\n| Regiao   | Total | Percent_total |\n|----------|-------|---------------|\n| Nordeste | 31232 | 14.17%        |\n\n```SQL\n-- Quantos alistados da Região Sul possuem Ensino Superior Completo?\nSELECT \n  EST.`Região`,\n  (SELECT count(*) FROM alistamento_exercito2022 EXE INNER JOIN estados_brasileiro EST ON EXE.UF_RESIDENCIA = EST.Sigla WHERE EST.`Região` = 'Sudeste') AS Total_Sudeste,\n  count(*) AS Total_Ensino_Sup,\n  format_number(count(*)/(SELECT count(*) FROM alistamento_exercito2022 EXE INNER JOIN estados_brasileiro EST ON EXE.UF_RESIDENCIA = EST.Sigla WHERE EST.`Região` = 'Sudeste'),\"0.00%\") AS Percent_Ensino_Sup\nFROM alistamento_exercito2022 EXE\n  INNER JOIN estados_brasileiro EST\n  ON EXE.UF_RESIDENCIA = EST.Sigla\nWHERE EXE.ESCOLARIDADE = 'Ensino Superior Completo' AND EST.`Região` = 'Sudeste'\nGROUP BY EST.`Região`\n```\n\n| Região   | Total_Sudeste | Total_Ensino_Sup | Percent_Ensino_Sup |\n|----------|---------------|-------------------|--------------------|\n| Sudeste  | 457845        | 684               | 0.15%              |\n\n```SQL\n-- Top 3 estados com maior número de alistados dentro do peso médio brasileiro\nWITH var_peso_medio AS (SELECT avg(EXE.PESO) AS peso_medio FROM alistamento_exercito2022 EXE)\n\nSELECT\n  EST.Sigla AS Estados,\n  count(*) AS Dentro_peso\nFROM alistamento_exercito2022 EXE\nINNER JOIN estados_brasileiro EST\nON EXE.UF_RESIDENCIA = EST.Sigla\nCROSS JOIN var_peso_medio\nWHERE EXE.PESO \u003c= peso_medio\nGROUP BY EST.Sigla\nORDER BY Dentro_peso DESC\nLIMIT 3\n```\nFigura 7: Top 3 estados x Peso\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/79b95d47-c789-4491-b202-6df98f8d4e26)\n\n```SQL\n-- Qual a distribuição de alistados por tipo de zona (Rural ou Urbana)?\nSELECT\n  EXE.ZONA_RESIDENCIAL AS Zona,\n  count(*) AS Total,\n  format_number(count(*)/(SELECT count(*) AS total_alistado FROM alistamento_exercito2022),\"0.00%\") AS Percent_total\nFROM alistamento_exercito2022 EXE\nGROUP BY EXE.ZONA_RESIDENCIAL\n```\nFigura 8: Zona x Alistados\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/96cf6467-ae8e-477a-9251-9ab64aa0c98e)\n\n```SQL\n-- Analisar a faixa etária x gênero dos alistados\n\nWITH ano_atual AS(SELECT year(getdate()) AS var_ano_atual)\n\nSELECT\n  CASE\n    WHEN (var_ano_atual - EXE.ANO_NASCIMENTO) \u003c= 28 THEN '18-28'\n    WHEN (var_ano_atual - EXE.ANO_NASCIMENTO) \u003e 28 AND (var_ano_atual - EXE.ANO_NASCIMENTO) \u003c= 38 THEN '28-38'\n    WHEN (var_ano_atual - EXE.ANO_NASCIMENTO) \u003e 38 AND (var_ano_atual - EXE.ANO_NASCIMENTO) \u003c= 48 THEN '38-48'\n    WHEN (var_ano_atual - EXE.ANO_NASCIMENTO) \u003e 48 AND (var_ano_atual - EXE.ANO_NASCIMENTO) \u003c= 58 THEN '48-58'\n    ELSE '58-100'\n  END AS Faixa_etaria,\n  SUM(CASE WHEN EXE.SEXO = \"F\" THEN 1 ELSE 0 END) AS Feminino,\n  format_number(SUM(CASE WHEN EXE.SEXO = \"F\" THEN 1 ELSE 0 END) / (SELECT count(*) FROM alistamento_exercito2022 WHERE SEXO = \"F\"),\"0.0000%\") AS Perc_Feminino,\n  SUM(CASE WHEN EXE.SEXO = \"M\" THEN 1 ELSE 0 END) AS Masculino,\n  format_number(SUM(CASE WHEN EXE.SEXO = \"M\" THEN 1 ELSE 0 END) / (SELECT count(*) FROM alistamento_exercito2022 WHERE SEXO = \"M\"),\"0.0000%\") AS Perc_Masculino\nFROM alistamento_exercito2022 EXE\nCROSS JOIN ano_atual\nGROUP BY Faixa_etaria\nORDER BY Faixa_etaria ASC\n```\nFigura 9: Faixa x Gênero\n\n![newplot (3)](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/80e8f3bd-b7d0-4100-aaa0-04d605b4afd3)\n\n```SQL\n-- Qual a idade máxima dos alistados do gênero feminino?\n\nSELECT\n  max(year(getdate())- EXE.ANO_NASCIMENTO) AS Idade_Maxima\nFROM alistamento_exercito2022 EXE\nWHERE EXE.SEXO = \"F\"\n```\n| Idade_Maxima |\n|--------------|\n|       39     |\n\n```SQL\n-- Qual o peso médio dos alistados do gênero MASCULINO? e do FEMININO?\nSELECT\n  EXE.SEXO AS `Gênero`,\n  round(avg(EXE.PESO),2) AS `Peso Médio`\nFROM alistamento_exercito2022 EXE\nGROUP BY EXE.SEXO\n```\nFigura 10: Peso Médio x Gênero\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/e1b29fcb-983b-4014-b7a6-100c52fd1430)\n\n```SQL\n-- Dentre os pesos entre os gêneros, quantos estão acima do peso conforme o IMC?\n\n/*\nIMC:\nAbaixo do peso: IMC abaixo de 18,5\nPeso normal: IMC entre 18,5 e 24,9\nSobrepeso: IMC entre 25 e 29,9\nObesidade Classe I: IMC entre 30 e 34,9\nObesidade Classe II: IMC entre 35 e 39,9\nObesidade Classe III: IMC 40 ou acima\n*/\n\n\nSELECT\n  CASE\n    WHEN EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003c= 18.5 THEN 'Abaixo do peso'\n    WHEN EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003e 18.5 AND EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003c= 24.9 THEN 'Peso Normal'\n    WHEN EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003e 25 AND EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003c= 29.9 THEN 'Sobrepeso'\n    WHEN EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003e 30 AND EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003c= 34.9 THEN 'Obsidade Classe 1'\n    WHEN EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003e 35 AND EXE.PESO/pow(EXE.ALTURA*0.01,2) \u003c= 39.9 THEN 'Obsidade Classe 2'\n    ELSE 'Obsidade Classe 3'\n  END AS indice_imc,\n  count(*) AS Total,\n  format_number(count(*)/(SELECT count(*) FROM alistamento_exercito2022),\"0.00%\") AS Percent_total\nFROM alistamento_exercito2022 EXE\nGROUP BY indice_imc\nORDER BY Total DESC\n```\n| indice_imc        | Total   | Percent_total |\n|-------------------|---------|---------------|\n| Obsidade Classe 3 | 724180  | 70.93%        |\n| Peso Normal       | 206073  | 20.18%        |\n| Sobrepeso         | 49725   | 4.87%         |\n| Abaixo do peso    | 21907   | 2.15%         |\n| Obsidade Classe 1 | 15396   | 1.51%         |\n| Obsidade Classe 2 | 3646    | 0.36%         |\n\nFigura 11: IMC (Índice de Massa Corporal)\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/52ebf5c3-95e0-49a2-b94a-abef7ae3c73d)\n\n```SQL\n-- Relação entre Dispensa ou não com os gêneros:\nSELECT\n  EXE.DISPENSA AS Tipo,\n  SUM(CASE WHEN EXE.SEXO = \"F\" THEN 1 ELSE 0 END) AS Feminino,\n  format_number(SUM(CASE WHEN EXE.SEXO = \"F\" THEN 1 ELSE 0 END)/(SELECT count(*) FROM alistamento_exercito2022 EXE WHERE EXE.SEXO = \"F\"),\"0.00%\") AS Percent_fem,\n  SUM(CASE WHEN EXE.SEXO = \"M\" THEN 1 ELSE 0 END) AS Masculino,\n  format_number(SUM(CASE WHEN EXE.SEXO = \"M\" THEN 1 ELSE 0 END)/(SELECT count(*) FROM alistamento_exercito2022 EXE WHERE EXE.SEXO = \"M\"),\"0.00%\") AS Percent_mas\nFROM alistamento_exercito2022 EXE\nGROUP BY EXE.DISPENSA\n```\nFigura 12: Dispensa por Gênero\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/95ab80fb-5e8d-4bec-a964-3ad46b721e05)\n\n```SQL\n-- Qual a altura média entre os alistados no geral?\nSELECT round(avg(EXE.ALTURA),2) AS `Altura Média` FROM alistamento_exercito2022 EXE\n```\n\n| Altura Média |\n|--------------|\n|   174.41     |\n\n```SQL\n-- Altura média por Região\nSELECT\n  EST.`Região`,\n  round(avg(EXE.ALTURA),2) AS `Altura Média`\nFROM alistamento_exercito2022 EXE\nLEFT JOIN estados_brasileiro EST\nON EXE.UF_RESIDENCIA = EST.Sigla\nGROUP BY EST.`Região`\nORDER BY `Altura Média` DESC\n```\n\nFigura 13: Altura Média por Região\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/6c21177f-f194-4d7e-802c-94de170b6a41)\n\n```SQL\n-- Distribuição de alistados x estado civil\nSELECT\n  EXE.ESTADO_CIVIL AS `Estado Civil`,\n  count(*) AS Total,\n  format_number(count(*)/(SELECT count(*) FROM alistamento_exercito2022),\"0.000%\") AS Percent_total\nFROM alistamento_exercito2022 EXE\nGROUP BY EXE.ESTADO_CIVIL\nORDER BY Total DESC\n```\n| Estado Civil           | Total   | Percent_total |\n|------------------------|---------|---------------|\n| Solteiro               | 1010987 | 99.026%       |\n| Outros                 | 6627    | 0.649%        |\n| Casado                 | 3184    | 0.312%        |\n| Desquitado             | 42      | 0.004%        |\n| Divorciado             | 40      | 0.004%        |\n| Separado Judicialmente | 35      | 0.003%        |\n| Viúvo                  | 12      | 0.001%        |\n\n## PARECER FINAL DA EXPLORAÇÃO DOS DADOS\n\n1. Em 2022 o número de alistados foi de 1.020.927 pessoas;\n2. Desse total de alistados, 1.020.848 (99,992%) são do gênero masculino e apenas 79 (0,008%) do gênero feminino;\n3. A distribuição do gênero feminino está mais concentrada na região Nordeste do Brasil, sendo 39,97% do total de 79 alistadas, em sequência o Sudeste com 30,38%;\n4. A distribuição do gênero masculino está mais concentrada na região Sudeste do Brasil, sendo 44,04% do total de 1.020.848 alistados, em sequência o Nordeste com 23,26%;\n5. A região do sudeste possui o maior número de alistados em 2022, equivalente a 44,85% do total geral alistado. A região Centro possui o menor número de alistados, equivalente a 7,56%;\n6. O top 3 estados com maiores números de alistados são: RJ(32926), SP(24708) e RS(22344);\n7. 14,17% dos alistados da região Nordeste possuem número de calçado maior ou igual a média do calçado brasileiro(40,95 cm);\n8. 0,15% (684) do total alistados na região sudeste (457.845) possuem Ensino Superior Completo;\n9. Os estados RJ, SP e RS possuem o maior número de alistados dentro do peso médio brasileiro;\n10. A faixa etária predominante dos alistados é entre 18 e 28 anos, sendo equivalente a 98,73% no gênero feminino e 99,98 no gênero masculino. Alguns outliers foram identificados, somente no gênero masculino, como por exemplo pelo menos 6 alistados com faixa etária de 58 a 100 anos;\n11. No gênero feminino, a maior idade registrada foi de 39 anos;\n12. O peso médio do gênero masculino é de 70,13kg e do feminino 63,05kg;\n13. Dentre os alistados, nota-se a predominância de IMC = Obsidade Classe 3 em 70,93% do total geral alistado;\n14. Para o gênero feminino, 65,82% do total de 79 alistadas foram dispensadas, o restante 34,18% não;\n15. Para o gênero masculino, 89,31% do total de 1.020.848 alistados foram dispensados, o restante 10,69% não;\n16. A altura média dos alistados é de 174,41 cm;\n17. Os alistados residentes no exterior possuem o maior registro de altura média, sendo de 182,78 cm. Já dentre as regiões do Brasil, o Sudeste apresenta o maior índice da altura média, equivalente a 175,21. O norte possui a menor média, 172,13cm;\n18. Em relação ao estado civil dos alistados, foi registrado que 99,026% são solteiros.\n\n\n\n\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Falbertofaraujo%2Fsql_eda_exercito2022","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Falbertofaraujo%2Fsql_eda_exercito2022","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Falbertofaraujo%2Fsql_eda_exercito2022/lists"}