{"id":15208866,"url":"https://github.com/albertofaraujo/sql_eda_capes","last_synced_at":"2026-02-06T03:02:12.940Z","repository":{"id":235856749,"uuid":"791398672","full_name":"AlbertoFAraujo/SQL_EDA_Capes","owner":"AlbertoFAraujo","description":"O objetivo desta análise exploratória é identificar padrões e tendências nas atividades de fomento a bolsas de estudos no Brasil e no exterior, promovidas pela Capes desde 2005","archived":false,"fork":false,"pushed_at":"2024-05-09T17:30:49.000Z","size":909,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-07-18T02:20:21.657Z","etag":null,"topics":["apache-spark","data-science","databricks","eda","sql"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/AlbertoFAraujo.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-04-24T16:42:35.000Z","updated_at":"2024-05-09T17:30:52.000Z","dependencies_parsed_at":"2024-04-24T19:16:29.352Z","dependency_job_id":"d627d7c8-9d84-4fa3-9aaf-97194fa5ad54","html_url":"https://github.com/AlbertoFAraujo/SQL_EDA_Capes","commit_stats":{"total_commits":5,"total_committers":1,"mean_commits":5.0,"dds":0.0,"last_synced_commit":"6deea54e16b992821cbb99f1a9aa78a9adce9df2"},"previous_names":["albertofaraujo/sql_eda_capes"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/AlbertoFAraujo/SQL_EDA_Capes","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_Capes","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_Capes/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_Capes/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_Capes/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/AlbertoFAraujo","download_url":"https://codeload.github.com/AlbertoFAraujo/SQL_EDA_Capes/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/AlbertoFAraujo%2FSQL_EDA_Capes/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":29147377,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-02-06T02:39:25.012Z","status":"ssl_error","status_checked_at":"2026-02-06T02:37:22.784Z","response_time":59,"last_error":"SSL_connect returned=1 errno=0 peeraddr=140.82.121.5:443 state=error: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["apache-spark","data-science","databricks","eda","sql"],"created_at":"2024-09-28T07:02:48.064Z","updated_at":"2026-02-06T03:02:12.921Z","avatar_url":"https://github.com/AlbertoFAraujo.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/bfbd333e-c110-48ba-801d-68a2e6708517)\n\n**Link Databrick:** [EDA_Capes_databrick](https://databricks-prod-cloudfront.cloud.databricks.com/public/4027ec902e239c93eaaa8714f173bcfc/4181035651798210/16913316101068/4641171831932757/latest.html)\n\n### Tecnologias utilizadas: \n| [\u003cimg align=\"center\" alt=\"sql\" height=\"60\" width=\"60\" src=\"https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/805dfaf3-4725-47f9-86d5-241953a018ab\"\u003e](https://learn.microsoft.com/en-us/sql/sql-server/?view=sql-server-ver16) | [\u003cimg align=\"center\" alt=\"databrick\" height=\"60\" width=\"60\" src=\"https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/b188ba83-b87f-4f80-b79f-e91be05602af\"\u003e](https://www.databricks.com/) | [\u003cimg align=\"center\" alt=\"apache_spark\" height=\"60\" width=\"100\" src=\"https://github.com/AlbertoFAraujo/SQL_EDA_exercito2022/assets/105552990/4b3cbec3-98da-499b-9d83-908ce9458d29\"\u003e](https://spark.apache.org/docs/latest/)|\n|:---:|:---:|:---:|\n| SQL | Databrick  | Apache Spark |\n\n- **SQL**: Linguagem padrão para consulta e manipulação de bancos de dados relacionais, permitindo operações como consulta, inserção, atualização e exclusão de dados.\n- **Databricks**: Plataforma de análise de dados e aprendizado de máquina baseada no Apache Spark, oferecendo um ambiente unificado para processamento em larga escala e desenvolvimento colaborativo.\n- **Apache Spark**: Framework open-source para processamento de big data, oferecendo uma API unificada para operações distribuídas em dados, com suporte a várias linguagens e módulos para processamento de streaming e machine learning.\n\u003chr\u003e\n\n### Sobre a base de Dados\n\nDivulgação das atividades de fomento a bolsas de estudos no Brasil e no exterior de programas de mobilidade internacional, registradas em sistemas de pagamentos informatizados da Capes a partir de 1984. O acervo de dados disponibilizado apresenta possibilidade de recortes por variáveis geográficas, perfil dos bolsistas, áreas de conhecimento e evolução dos valores pagos ao longo da série histórica.\n\n**Fonte:** https://dadosabertos.capes.gov.br/group/bolsas-ativas-em-programas-de-mobilidade-internacional\n\n\u003chr\u003e\n\n### Objetivo: \n\nO objetivo desta análise exploratória é identificar padrões e tendências nas atividades de fomento a bolsas de estudos no Brasil e no exterior, promovidas pela Capes desde 2005. Utilizando os dados disponibilizados nos sistemas de pagamentos informatizados da Capes, pretendemos realizar recortes por variáveis geográficas, perfil dos bolsistas, áreas de conhecimento e evolução dos valores pagos ao longo da série histórica. O propósito é fornecer insights para otimizar a alocação de recursos, identificar áreas de maior demanda e avaliar o impacto das políticas de fomento à mobilidade internacional no desenvolvimento acadêmico e científico do país.\n\n\u003chr\u003e\n\n### Script SQL\n```SQL\n-- Esta consulta seleciona todos os registros da tabela \"bolsas_capes_csv\" no banco de dados padrão (default) e os exibe.\nSELECT\n  *\nFROM\n  default.bolsas_capes_csv AS capes;\n```\n```SQL\n-- Esta consulta calcula o total de bolsas concedidas, contando o número de registros na tabela \"bolsas_capes_csv\".\n\nSELECT\n  COUNT(*) AS `Total Bolsas`\nFROM\n  bolsas_capes_csv AS capes;\n```\n| Total Bolsas |\n|--------------|\n|      18653   |\n\n```SQL\n-- Esta consulta calcula a quantidade total de beneficiários distintos presentes na tabela \"bolsas_capes_csv\".\n\nSELECT\n  COUNT(DISTINCT(capes.beneficiario)) AS `Total Beneficiários`\nFROM\n  bolsas_capes_csv AS capes;\n```\n| Total Beneficiários |\n|---------------------|\n|        13380        |\n\n```SQL\n-- Este bloco de código calcula a quantidade de beneficiários por ano e cria uma tabela temporária chamada quantidade_beneficiarios.\n\nWITH quantidade_beneficiarios AS (\n  -- Esta subconsulta calcula a quantidade de beneficiários por ano e mês.\n  SELECT\n    capes.ano_inicial AS Ano,\n    capes.mes_inicial AS Mes,\n    count(DISTINCT(capes.beneficiario)) AS `Total Beneficiários`\n  FROM\n    bolsas_capes_csv AS capes\n  GROUP BY\n    capes.ano_inicial,\n    capes.mes_inicial\n)\n\n-- Esta consulta principal utiliza a tabela temporária quantidade_beneficiarios para calcular o total acumulado de beneficiários, bem como a variação percentual ano a ano (YoY).\n\nSELECT\n  Ano,\n  Mes,\n  `Total Beneficiários`,\n  -- Esta expressão calcula o total acumulado de beneficiários até o momento atual.\n  sum(`Total Beneficiários`) OVER (\n    ORDER BY\n      Ano ROWS BETWEEN UNBOUNDED PRECEDING\n      AND CURRENT ROW\n  ) AS `Total Acumulado`,\n  -- Esta expressão calcula a variação percentual ano a ano (YoY) no número de beneficiários.\n  format_number(\n    (\n      `Total Beneficiários` - lag(`Total Beneficiários`) OVER (\n        ORDER BY\n          Ano\n      )\n    ) / lag(`Total Beneficiários`) OVER (\n      ORDER BY\n        Ano\n    ),\n    \"0.00%\"\n  ) AS YoY\nFROM\n  quantidade_beneficiarios\nORDER BY\n  Ano ASC,\n  Mes ASC;\n```\n\n| Ano  | Mes | Total Beneficiários | Total Acumulado | YoY    |\n|------|-----|---------------------|-----------------|--------|\n| 2005 |   4 |                   1 |            null |        |\n| 2005 |   9 |                   1 |               2 | 0.00%  |\n| 2006 |   3 |                  18 |              97 | -56.10%|\n| 2006 |   4 |                  18 |             115 | 0.00%  |\n| 2006 |   6 |                   1 |               8 | 0.00%  |\n| 2006 |   7 |                   1 |               7 | -75.00%|\n| 2006 |   8 |                  27 |             142 | 50.00% |\n| 2006 |   9 |                  41 |              79 | 36.67% |\n| 2006 |  10 |                  30 |              38 | 2900.00%|\n| 2006 |  11 |                   8 |             150 | -70.37%|\n\n\nFigura 1: Quantidade de beneficiários x Ano x Mês\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/d7b06154-340e-45fe-8880-100b425675bf)\n\nFigura 2: Acumulado x Ano\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/20c5eb7c-92b8-49da-af2d-2e8ce41bf08a)\n\n\n```SQL\n-- Esta consulta cria ou altera uma view chamada \"vw_bolsas_valores\" que contém informações sobre beneficiários com mais de uma bolsa e o valor total das bolsas, considerando conversão de moeda, se disponível.\nALTER VIEW vw_bolsas_valores AS(\n  SELECT\n    capes.beneficiario AS `Beneficiário`,\n    COUNT(*) AS `Quantidade de Bolsas`,\n    CASE\n      WHEN COUNT(*) = 1 THEN '1'\n      WHEN COUNT(*) \u003e= 2\n      AND COUNT(*) \u003c= 4 THEN '2-4'\n      ELSE '5-6'\n    END AS `Faixa Bolsas`,\n    ROUND(\n      SUM(\n        IF(\n          capes.sigla_moeda = 'BRL',\n          capes.valor_recebido_total,\n          capes.valor_recebido_total * moeda.`Fator conversao`\n        )\n      ),\n      2\n    ) AS `Valor das Bolsas com conversão`\n  FROM\n    bolsas_capes_csv AS capes\n    LEFT JOIN conversao_moeda_1_csv moeda ON capes.sigla_moeda = moeda.Moeda\n  GROUP BY\n    capes.beneficiario\n);\n-- Esta consulta seleciona os dados da view \"vw_bolsas_valores\" e agrupa por faixa de bolsas, ou seja, quantas pessoas possuem até 6 bolsas registradas em seu nome\n-- A coluna Quantidade Bolsista informa o número por cpf distinto\nSELECT\n  `Faixa Bolsas`,\n  COUNT(*) AS Total,\n  format_number(\n    COUNT(*) /(\n      SELECT\n        COUNT(*)\n      FROM\n        vw_bolsas_valores\n    ),\n    \"0.00%\"\n  ) AS Percent_Total\nFROM\n  vw_bolsas_valores AS capes\nGROUP BY\n  `Faixa Bolsas`\nORDER BY\n  `Faixa Bolsas` ASC\n```\n\n| Faixa Bolsas | Total | Percent_Total |\n|--------------|-------|---------------|\n|            1 |  9217 |         68.89%|\n|          2-4 |  4161 |         31.10%|\n|          5-6 |     2 |          0.01%|\n\n\nFigura 3: Total de bolsas x beneficiários\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/ddf8aae9-9d28-47d7-b4cc-dc4879e7f6d1)\n\n```SQL\n-- Esta consulta seleciona os dados da view \"vw_bolsas_valores\" e os ordena pelo valor total das bolsas sem conversão em ordem decrescente, limitando os resultados às 5 primeiras linhas.\n\nSELECT\n  capes.`Faixa Bolsas`,\n  capes.`Valor das Bolsas com conversão`\nFROM\n  vw_bolsas_valores AS capes\nORDER BY\n  `Valor das Bolsas com conversão` DESC\nLIMIT\n  5;\n```\n| Faixa Bolsas | Valor das Bolsas com conversão |\n|--------------|--------------------------------|\n|          2-4 |                      1142276.9|\n|          2-4 |                      1123586.51|\n|          2-4 |                      1048089.4 |\n|          2-4 |                      1017713.69|\n|          2-4 |                      1003164.38|\n\n\n```SQL\n-- Esta consulta calcula a duração em anos de cada bolsa, o total de bolsas para cada duração e a porcentagem de bolsas em relação ao total de bolsas.\n\nSELECT\n  (capes.ano_final - capes.ano_inicial) AS `Duração (anos)`,\n  count(*) AS `Total Bolsas`,\n  format_number(\n    COUNT(*) / (\n      SELECT\n        COUNT(*)\n      FROM\n        bolsas_capes_csv\n    ),\n    \"0.00%\"\n  ) AS Percent_Bolsas\nFROM\n  bolsas_capes_csv AS capes\nGROUP BY\n  `Duração (anos)`\nORDER BY\n  `Total Bolsas` DESC;\n```\n\n| Duração (anos) | Total Bolsas | Percent_Bolsas |\n|----------------|--------------|----------------|\n|              1 |         9271 |         49.70% |\n|              2 |            0 |         36.71% |\n|              3 |         1308 |          7.01% |\n|              4 |          634 |          3.40% |\n|              5 |          459 |          2.46% |\n|              6 |           69 |          0.37% |\n|              7 |           34 |          0.18% |\n|              8 |           19 |          0.10% |\n|              9 |           10 |          0.05% |\n|             10 |            2 |          0.01% |\n\n\n```SQL\n-- Esta consulta seleciona os valores totais das bolsas convertidos para a moeda local, se aplicável, e remove valores duplicados.\n\nSELECT\n  DISTINCT(\n    IF(\n      capes.sigla_moeda = 'BRL',\n      capes.valor_recebido_total * 1,\n      capes.valor_recebido_total * moeda.`Fator conversao`\n    )\n  ) AS Valores\nFROM\n  bolsas_capes_csv AS capes\n  LEFT JOIN conversao_moeda_1_csv AS moeda ON capes.sigla_moeda = moeda.Moeda\nWHERE\n  capes.valor_recebido_total \u003e 0\nORDER BY\n  Valores DESC;\n```\nFigura 4: Boxplot dos valores das bolsas\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/56410606-5718-4e62-a833-c1e88f54c332)\n\n\n\n```SQL\n-- Esta consulta seleciona informações sobre a bolsa com o maior valor recebido convertido para a moeda local, se disponível.\n\nSELECT\n  capes.ano_inicial,\n  capes.ano_final,\n  capes.beneficiario,\n  capes.programa_capes,\n  capes.pais_destino,\n  capes.sigla_moeda,\n  capes.grande_area_conhecimento,\n  capes.nivel_ensino,\n  capes.valor_recebido_total,\n  moeda.`Fator conversao`,\n  capes.valor_recebido_total * moeda.`Fator conversao` AS valor_recebido_convertido\nFROM\n  bolsas_capes_csv AS capes\n  LEFT JOIN conversao_moeda_1_csv AS moeda ON capes.sigla_moeda = moeda.Moeda\nORDER BY\n  valor_recebido_convertido DESC\nLIMIT\n  1;\n```\n\n```SQL\n-- Esta consulta calcula a quantidade de bolsas por programa da Capes.\n\nSELECT\n  capes.programa_capes,\n  COUNT(*) AS Total,\n  format_number(\n    COUNT(*) / (\n      SELECT\n        COUNT(*)\n      FROM\n        bolsas_capes_csv\n    ),\n    \"0.00%\"\n  ) AS Percent_Bolsas\nFROM\n  bolsas_capes_csv AS capes\nGROUP BY\n  capes.programa_capes\nORDER BY\n  Total DESC;\n```\n\n| programa_capes                                                                                      | Total | Percent_Bolsas |\n|-----------------------------------------------------------------------------------------------------|-------|----------------|\n| PDSE - PROGRAMA DE DOUTORADO SANDUÍCHE NO EXTERIOR                                                  | 5890  | 31.58%         |\n| GS/CSF - GRADUAÇÃO SANDUÍCHE - PROGRAMA CIÊNCIA SEM FRONTEIRAS                                       | 1394  | 7.47%          |\n| PDEE - ESTÁGIO DE DOUTORANDO                                                                        | 1136  | 6.09%          |\n| PPDE - PROGRAMA DE PÓS-DOUTORADO NO EXTERIOR                                                         | 969   | 5.19%          |\n| BRAFITEC - BRASIL FRANÇA ENGENHARIA TECNOLOGIA                                                       | 833   | 4.47%          |\n| DPE - PROGRAMA DE DOUTORADO PLENO NO EXTERIOR                                                        | 827   | 4.43%          |\n| PROGRAMA ESTUDANTES CONVÊNIO DE PÓS-GRADUAÇÃO                                                        | 671   | 3.60%          |\n| ES - PROGRAMA DE ESTÁGIO SÊNIOR NO EXTERIOR                                                          | 632   | 3.39%          |\n| PDPI - PROGRAMA DE DESENVOLVIMENTO PROFISSIONAL PARA PROFESSORES DE LÍNGUA INGLESA NOS ESTADOS UNIDOS | 537   | 2.88%          |\n\n\n```SQL\n-- Esta consulta calcula a quantidade de bolsas por país de destino, mostrando apenas os 10 principais países.\n\nSELECT\n  temp.pais_destino,\n  COUNT(*) AS Quantidade,\n  FORMAT_NUMBER(\n    COUNT(*) / (\n      SELECT\n        COUNT(*)\n      FROM\n        (\n          SELECT\n            DISTINCT(capes.cpf),\n            capes.pais_destino\n          FROM\n            bolsas_capes_csv AS capes\n        )\n    ),\n    \"0.00%\"\n  ) AS Percent_total\nFROM\n  (\n    SELECT\n      DISTINCT(capes.cpf),\n      capes.pais_destino\n    FROM\n      bolsas_capes_csv AS capes\n  ) AS temp\nGROUP BY\n  temp.pais_destino\nORDER BY\n  Quantidade DESC\nLIMIT\n  10;\n```\n\nFigura 5: Top 10 países destino\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/d68a0e86-e118-49b2-bd2a-ab8cbb899b1b)\n\n\n```SQL\n-- Esta consulta cria uma nova view chamada \"vw_capes_unique\" para restringir as bolsas apenas por CPF.\n\nALTER VIEW vw_capes_unique AS (\n  SELECT\n    DISTINCT(capes.cpf) AS temp,\n    *\n  FROM\n    bolsas_capes_csv AS capes\n);\n\n```\n\n```SQL\n-- Quantidade de bolsas por Área do Programa\nSELECT\n  coalesce(temp.grande_area_conhecimento, 'NÃO INFORMADO') AS `Grande Área`,\n  count(*) AS Total,\n  format_number(\n    COUNT(*) /(\n      SELECT\n        COUNT(*)\n      FROM\n        vw_capes_unique\n    ),\n    \"0.00%\"\n  ) AS Percent_total\nFROM\n  vw_capes_unique AS temp\nGROUP BY\n  temp.grande_area_conhecimento\nORDER BY\n  Total DESC\n```\n\nFigura 6: Área x distribuição de bolsas\n\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/54d43a62-217c-4097-80f9-a4e77c63826f)\n\n\n```SQL\n-- Esta consulta calcula o número de bolsas por grande área de conhecimento.\n\nSELECT\n  COALESCE(capes.area_conhecimento, 'NÃO INFORMADO') AS `Área Específica`,\n  COUNT(*) AS Total,\n  FORMAT_NUMBER(\n    COUNT(*) / (\n      SELECT\n        COUNT(*)\n      FROM\n        vw_capes_unique\n    ),\n    \"0.00%\"\n  ) AS Percent_total\nFROM\n  vw_capes_unique AS capes\nGROUP BY\n  capes.area_conhecimento\nORDER BY\n  Total DESC;\n```\n\n| Área Específica       | Total | Percent_total |\n|-----------------------|-------|---------------|\n| NÃO INFORMADO         | 5957  | 31.95%        |\n| EDUCAÇÃO              | 676   | 3.63%         |\n| AGRONOMIA             | 623   | 3.34%         |\n| ENGENHARIA ELÉTRICA   | 571   | 3.06%         |\n| ENGENHARIA MECÂNICA   | 530   | 2.84%         |\n| MEDICINA              | 529   | 2.84%         |\n| CIÊNCIA DA COMPUTAÇÃO | 525   | 2.82%         |\n| ENGENHARIA DE PRODUÇÃO| 380   | 2.04%         |\n| LETRAS                | 375   | 2.01%         |\n| QUÍMICA               | 344   | 1.84%         |\n\n\n```SQL\n-- Esta consulta calcula o número de bolsas por nível de ensino.\n\nSELECT \n  COALESCE(capes.nivel_ensino,'NÃO INFORMADO') AS `Nível Ensino`, \n  COUNT(*) AS Total,\n  FORMAT_NUMBER(COUNT(*) / (SELECT COUNT(*) FROM vw_capes_unique), \"0.00%\") AS Percent_total\nFROM vw_capes_unique AS capes\nGROUP BY capes.nivel_ensino\nORDER BY Total DESC\nLIMIT 5;\n```\n\n| Nível Ensino                               | Total | Percent_total |\n|--------------------------------------------|-------|---------------|\n| DOUTORADO SANDUÍCHE                       | 8592  | 46.08%        |\n| GRADUAÇÃO SANDUÍCHE                       | 3988  | 21.39%        |\n| DOUTORADO PLENO                           | 1800  | 9.65%         |\n| ESTÁGIO PÓS-DOUTORAL                      | 1633  | 8.76%         |\n| CAPACITAÇÃO PROFESSORES DA EDUCAÇÃO BÁSICA| 684   | 3.67%         |\n\n\n\n```SQL\n-- Esta consulta calcula o número de bolsas por estado de origem da instituição.\n\nSELECT\n  COALESCE(capes.uf_instituicao_origem, 'NÃO INFORMADO') AS `Estado de Origem da Instituição`,\n  COUNT(*) AS Total,\n  FORMAT_NUMBER(\n    COUNT(*) / (\n      SELECT\n        COUNT(*)\n      FROM\n        vw_capes_unique\n    ),\n    \"0.00%\"\n  ) AS Percent_total\nFROM\n  vw_capes_unique AS capes\nGROUP BY\n  capes.uf_instituicao_origem\nORDER BY\n  Total DESC\nLIMIT 5;\n```\n\nFigura 7: Estados x Quantidades de bolsas\n![image](https://github.com/AlbertoFAraujo/SQL_EDA_Capes/assets/105552990/2507505b-a97c-45a4-b84e-598e0ae1debd)\n\n\n\n```SQL\n-- Esta consulta calcula o número de bolsas por instituição de ensino de origem.\n\nSELECT\n  COALESCE(capes.instituicao_ensino_origem, 'NÃO INFORMADO') AS `Instituição de Ensino de Origem`,\n  COUNT(*) AS Total,\n  FORMAT_NUMBER(\n    COUNT(*) / (\n      SELECT\n        COUNT(*)\n      FROM\n        vw_capes_unique\n    ),\n    \"0.00%\"\n  ) AS Percent_total\nFROM\n  vw_capes_unique AS capes\nGROUP BY\n  capes.instituicao_ensino_origem\nORDER BY\n  Total DESC\nLIMIT 5;\n```\n\n| Instituição de Ensino de Origem           | Total | Percent_total |\n|-------------------------------------------|-------|---------------|\n| UNIVERSIDADE DE SÃO PAULO                 | 1814  | 9.73%         |\n| NÃO INFORMADO                             | 986   | 5.29%         |\n| UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL | 977   | 5.24%         |\n| UNIVERSIDADE FEDERAL DE SANTA CATARINA    | 854   | 4.58%         |\n| UNIVERSIDADE ESTADUAL DE CAMPINAS         | 846   | 4.54%         |\n\n\n```SQL\n-- Esta consulta calcula os maiores e menores valores de bolsas por grande área de conhecimento, excluindo valores iguais a zero.\n\nSELECT\n  COALESCE(capes.grande_area_conhecimento, 'NÃO INFORMADO') AS `Grande Área`,\n  ROUND(MAX(capes.valor_recebido_bolsa), 2) AS `Maior valor Bolsa`,\n  ROUND(MIN(capes.valor_recebido_bolsa), 2) AS `Menor valor Bolsa`\nFROM\n  bolsas_capes_csv AS capes\nWHERE\n  capes.valor_recebido_bolsa \u003e 0\nGROUP BY\n  capes.grande_area_conhecimento\nORDER BY\n  `Maior valor Bolsa` DESC,\n  `Menor valor Bolsa` DESC;\n```\n| Grande Área                       | Maior valor Bolsa | Menor valor Bolsa |\n|-----------------------------------|-------------------|-------------------|\n| CIÊNCIAS AGRÁRIAS                 | 99000             | 10010             |\n| CIÊNCIAS BIOLÓGICAS               | 99000             | 10010             |\n| CIÊNCIAS DA SAÚDE                 | 99000             | 10010             |\n| MULTIDISCIPLINAR                  | 99000             | 10010             |\n| CIÊNCIAS HUMANAS                  | 9996              | 101000            |\n| ENGENHARIAS                       | 9976              | 10005             |\n| CIÊNCIAS SOCIAIS APLICADAS        | 9947              | 10010             |\n| NÃO INFORMADO                     | 9900              | 10440             |\n| LINGÜÍSTICA, LETRAS E ARTES       | 9900              | 10140             |\n| CIÊNCIAS EXATAS E DA TERRA        | 9900              | 10005             |\n\n****\n### Parecer da Análise Exploratória:\n- Entre 2005 e 2019 foram disponibilizadas cerca de 18653 bolsas Capes, podendo ser vinculada mais de uma bolsa por \tCPF;\n- Foram registrados 13380 beneficiários das bolsas;\n- A quantidade de bolsas concedidas, cresceu de forma constante de 2005 a 2010, um aumento de 500 bolsas. Em 2012 houve um salto de mais 400%, chegando a quase 1000 bolsas. Esse aumento pode estar relacionado a algum programa ou política de incentivo à mobilidade internacional nesse período;\n- A quantidade de bolsas concedidas caiu de forma acentuada de 2012 a 2019, voltando aos níveis de 2005. Em 2019, foram concedidas apenas cerca de 120 bolsas. Essa queda pode estar relacionada a algum fator econômico, político ou social que afetou a disponibilidade ou a demanda por bolsas nesse período;\n- A quantidade de bolsas concedidas variou nos anos intermediários, mas a tendência geral foi descendente após o pico de 2012. Alguns anos apresentaram aumentos ou quedas mais expressivos, como 2009, 2011, 2013 e 2018. Essas flutuações podem estar relacionadas a eventos específicos ou a mudanças pontuais nas condições de concessão das bolsas;\n- 0.01% (2) dos beneficiários de bolsas CAPES possuem entrem 5 e 6 bolsas registradas em seu CPF. 31.10% (4161) de 2 a 4 e 68.89% (9217) possuem apenas o registro de 1 bolsa;\n- O maior valor de bolsa já convertida em Real, considerando a soma das bolsas vinculadas ao mesmo beneficiário(mesmo CPF) foi de R$1.142.276,9 e está na faixa de 2 a 4 bolsas. Os demais 4 maiores valores de bolsas acumulativas também estão na faixa de 2-4 bolsas por CPF. Concluíndo que a quantidade de bolsas não é fator relacionado ao valor da bolsa;\n- A bolsa com maior valor único, sem considerar acumulativa para o mesmo CPF foi registrada em R$887.150,80.\n- Os valores únicos por bolsa, estão dentro do intervalo entre 37k e 120k. Alguns outliers foram identificados com valores de bolsas acima de 230k, sendo o maior valor de bolsa registrado em R$887.150,80 no programa de DPE - PROGRAMA DE DOUTORADO PLENO NO EXTERIOR com destino ao país da Holanda na área de Ciências da Saúde e nível de ensino em Doutorado Pleno;\n- Das 18653 bolsas, 49,70% são para programas de 1 ano e 36,71% para programas inferiores a 1 ano, sendo esses provavelmente referentes a estágios, capacitações, itnercâmbios ou outras modalidades de curta duração;\n- Os programas com duração de 10 anos são destinados ao programa da CAPES: UAB-MOÇAMBIQUE - PROGRAMA DE APOIO À EXPANSÃO DA EDUCAÇÃO SUPERIOR À DISTÂNCIA NA REPÚBLICA DE MOÇAMBIQUE, totalizando um valor de R$20170;\n- O programa PDSE - Programa de Doutorando Sanduíche no Exterior é responsável por 31,58% (5890) das bolsas concedidas do Capes;\n- Estados Unidos é o país com maior indicador de destino das bolsas capes dentre o período analisado, com 26,72% (Cerca de 3580 bolsas destinadas). Em sequência, França com 11,58% de programas destinados;\n- Dentre as grandes áreas disponíveis ao programa de bolsas, 16,18% são destinadas à Ciências Humanas e em seguida 16,16% para Engenharias;\n- Dentre as subáreas de conhecimento, 3,63% (676) das bolsas são destinadas à Educação, seguida de 3,34% (623) para Agronomia. 31,95% (5957) não foram informadas na base;\n- Em relação ao nível de ensino, 46,08% (8592) destina-se ao Doutorado Sanduíche e 21,39% (3988) à Graduação Sanduíche;\n- Ao dados demográficos das instituições de ensino, cerca de 25,51% (4756) são do estado de São Paulo e 11,31% (2108) do Rio de Janeiro;\n- 1814 beneficiários das bolsas capes são da Universidade de São Paulo (USP).\n\n\n\n\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Falbertofaraujo%2Fsql_eda_capes","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Falbertofaraujo%2Fsql_eda_capes","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Falbertofaraujo%2Fsql_eda_capes/lists"}