{"id":21956552,"url":"https://github.com/samuelbarbosadev/roof_imoveis_data_analysis","last_synced_at":"2026-04-12T11:51:23.983Z","repository":{"id":155163469,"uuid":"617025210","full_name":"SamuelBarbosaDev/Roof_Imoveis_Data_Analysis","owner":"SamuelBarbosaDev","description":"The company hired you because they want to know what would be the 5 properties they should invest in and why, and which 5 you would not recommend investing in at all.","archived":false,"fork":false,"pushed_at":"2023-03-27T14:34:32.000Z","size":4524,"stargazers_count":1,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-08-13T11:54:20.326Z","etag":null,"topics":["data-preparation","data-understanding","data-visualization","pandas","python"],"latest_commit_sha":null,"homepage":"","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/SamuelBarbosaDev.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2023-03-21T14:54:59.000Z","updated_at":"2023-09-09T16:25:02.000Z","dependencies_parsed_at":null,"dependency_job_id":"7cd664af-eb8e-42fb-b2b7-2d55a6a18ea4","html_url":"https://github.com/SamuelBarbosaDev/Roof_Imoveis_Data_Analysis","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/SamuelBarbosaDev/Roof_Imoveis_Data_Analysis","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/SamuelBarbosaDev%2FRoof_Imoveis_Data_Analysis","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/SamuelBarbosaDev%2FRoof_Imoveis_Data_Analysis/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/SamuelBarbosaDev%2FRoof_Imoveis_Data_Analysis/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/SamuelBarbosaDev%2FRoof_Imoveis_Data_Analysis/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/SamuelBarbosaDev","download_url":"https://codeload.github.com/SamuelBarbosaDev/Roof_Imoveis_Data_Analysis/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/SamuelBarbosaDev%2FRoof_Imoveis_Data_Analysis/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":31713876,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-04-12T06:22:27.080Z","status":"ssl_error","status_checked_at":"2026-04-12T06:21:52.710Z","response_time":58,"last_error":"SSL_connect returned=1 errno=0 peeraddr=140.82.121.5:443 state=error: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["data-preparation","data-understanding","data-visualization","pandas","python"],"created_at":"2024-11-29T08:34:57.510Z","updated_at":"2026-04-12T11:51:23.969Z","avatar_url":"https://github.com/SamuelBarbosaDev.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Roof Imóveis:\n### Índice\n\n- [Contextualização](#contextualização)\n- [Metodologia Aplicada](#metodologia-aplicada)\n- [Entendimento do Negócio Aplicada](#metodologia-aplicada)\n  - [Metricas](#metricas)\n- [Entendimento dos Dados](#entendimento-dos-dados)\n  - [Variáveis](#variáveis)\n  - [Variáveis Escolhidas](#variáveis-Escolhidas)\n- [Preparação dos Dados](#preparação-dos-dados)\n  - [Alterando para int a coluna bathrooms](#alterando-para-int-a-coluna-bathrooms)\n  - [Alterando para int a coluna floors](#alterando-para-int-a-coluna-floors)\n  - [IDs repetidos](#ids-repetidos)\n  - [As 5 cidades com a maior concentração de imóveis](#as-5-cidades-com-a-maior-concentração-de-imóveis)\n  - [As 5 cidades com o ft2 mais caro](#as-5-cidades-com-o-ft2-mais-caro)\n  - [As 5 cidades com os maiores terrenos](#as-5-cidades-com-os-maiores-terrenos)\n- [Modelagem](#modelagem)\n    - [Ranqueamento das lojas](#ranqueamento-das-lojas)\n- [Avaliação](#avaliação)\n- [Implantação](#implantação)\n- [Conclusão](conclusão)\n    - [Os 5 recomendados](#os-5-recomendados)\n    - [Os 5 que **NÃO** recomendados](#os-5-que-não-recomendados)\n- [Ambiente virtual e Dependências](#ambiente-virtual-e-dependências)\n\n\n### Contextualização:\nRoof Imóveis é uma das maiores empresas do ramo imobiliário Brasileiro\ne quer expandir sua área de atuação fazendo um investimento internacional,\ncom isso, ela contratou você para uma consultoria estratégica.\nA empresa irá investir em imóveis no Condado de County, nos Estados\nUnidos. \n\n### Metodologia Aplicada:\nA análise foi realizada utilizando o modelo CRISP-DM, o CRISP-DM (Cross Industry Standard Process for Data Mining) é um modelo padrão de processo para projetos de mineração de dados que define um conjunto de fases e tarefas que devem ser executadas para desenvolver soluções de mineração de dados efetivas.\n\n![CRISP-DM](/core/img/CRISP-DM.png)\n\nO modelo CRISP-DM é uma abordagem sistemática e estruturada para a mineração de dados que ajuda as empresas a desenvolver soluções de mineração de dados de maneira eficiente e eficaz, reduzindo o tempo e os custos do projeto.\n\n### Entendimento do Negócio:\nA Roof Imóveis busca expandir sua atuação\nno mercado imobiliário internacional e\ncontratou uma consultoria estratégica para\ninvestir em imóveis no Condado de King, nos\nEstados Unidos. \n\n### Metricas:\n1. **Localização**: o imóvel deve estar em uma das 10 cidades mais populosas de Washington.\n2. **Valor do metro quadrado**: deve ser menor que a média da cidade.\n3. **Preço**: deve ser menor que a média da cidade.\n4. **Condição do imóvel**: a condição do imóvel deve ser igual a 5.\n5. **Tamanho do terreno**: deve ser maior que a média da cidade.\n6. **Quantidade de quartos**: deve ser maior que a média da cidade.\n7. **Quantidade de banheiros**: deve ser maior que a média da cidade.\n8. **Ano de construção**: deve ser maior que 1980.\n\n## Entendimento dos Dados:\n### Variáveis:\n![Data Frame](/core/img/descrição_do_df.png)\n\n### Variáveis Escolhidas:\n![Data Frame](/core/img/variáveis_escolhidas.png)\n\n## Preparação dos Dados:\n### Alterando para int a coluna bathrooms:\n1. Ao iniciar a análise dos dados, deparei-me com a\ncoluna \"bathrooms\" e percebi que havia informações\nreferentes a casas com, por exemplo, 2.25, 4.50, 1.75\nbanheiros. Esses valores não faziam sentido para a\nminha análise. Então, optei por convertê-los em\nnúmeros inteiros. Lembrando que pesquisei e\ndescobri que esses dados significam que o banheiro\nem questão não é completo, ou seja, possui todos os\nitens que um banheiro normalmente tem, exceto\npelo chuveiro, a pia ou o vaso sanitário. Apesar\ndisso, concluí que esses dados não eram relevantes\npara a minha análise.\n\n### Alterando para int a coluna floors:\n2. Posteriormente, encontrei uma situação\nsemelhante na coluna \"floors\", onde havia\ninformações referentes a casas com 1.5, 2.5, 3.5\nandares. Como essa coluna indicava o número de\nandares da casa, optei por convertê-los em números\ninteiros também.\n\n### IDs repetidos:\n3. Ao analisar o data frame, identifiquei 353 imóveis\nque haviam sido vendidos mais de uma vez. Uma das\nmétricas sugeridas foi a valorização desses imóveis.\nNo entanto, optei por ignorar essa métrica por dois\nmotivos. Primeiramente, uma valorização passada\nnão necessariamente indica uma valorização futura.\nAlém disso, dos 21613 imóveis analisados, apenas\n353 haviam sido vendidos mais de uma vez.\nPortanto, optei por remover os IDs duplicados.\n\n### As 5 cidades com a maior concentração de imóveis:\n![Data Frame](/core/img/as_5_cidades_com_a_maior_concentração_de_imóveis.png)\n\n### As 5 cidades com o ft2 mais caro:\n![Data Frame](/core/img/as_5_cidades_com_a_maior_o_valor_do_ft2_por_cidade.png)\n\n### As 5 cidades com os maiores terrenos:\n![Data Frame](/core/img/as_5_cidades_com_a_maior_o_tamanho_do_terreno_por_cidade.png)\n\n\n## Modelagem:\n### Ranqueamento das lojas:\nPor fim, mas não menos importante, criei um algoritmo de ranqueamento de imóveis. Esse algoritmo consiste em atribuir notas aos imóveis filtrados previamente. Cada critério estipulado tem um peso maior ou menor dependendo do caso, sendo que a nota máxima que um imóvel pode receber é 100.\n\nAntes de atribuirmos notas aos imóveis, precisamos filtrar os dados. Como temos mais de 21 mil linhas, utilizei os seguintes filtros: condição mínima igual a 5, ano de construção maior ou igual a 1980, número de quartos maior ou igual a 1, número de banheiros maior ou igual a 1 e preço máximo menor ou igual a 1 milhão. Após a filtragem, chegou o momento de ranquear os imóveis.\n\nOs critérios utilizados para ranqueá-los foram:\n- **A Localização**, se o imóvel está dentro das 10 cidades mais populosas, ele ganha 30 pontos;\n- **O valor do ft2**, se o imóvel estiver com um valor do ft2 abaixo da média da cidade, concluo que\nele está subvalorizado e ganhará mais 30 pontos;\n- **O tamanho do terreno**, se o imóvel for maior que a média da cidade, ganhará mais 20 pontos;\n- **O número de quartos**, se o imóvel tiver mais quartos que a média da cidade, ganhará mais 10\npontos;\n- **O número de banheiros**, se o imóvel tiver mais banheiros que a média da cidade, ganhará mais\n10 pontos.\n\nCritérios  | Notas\n--------- | ----\nCidade    | 30\nValor do ft2    | 30\nTamanho do terreno    | 20\nQuartos    | 10\nBanheiros    | 10\n\n## Avaliação:\nPara escolher os imóveis recomendados e não recomendados, utilizei os critérios definidos acima, como localização, valor do ft2, tamanho do terreno, número de quartos e número de banheiros.\n\nNo caso dos imóveis recomendados, escolhi aqueles com valores do pé quadrado abaixo da média da cidade e que estão localizados em Seattle, que é uma das 10 cidades mais populosas dos Estados Unidos. Além disso, todos os imóveis possuem tamanho do terreno maior que a média da cidade, número de quartos maior que a média da cidade e número de banheiros maior que a média da cidade, o que contribuiu para que esses imóveis recebessem notas altas no algoritmo de ranqueamento.\n\nJá para os imóveis não recomendados, escolhi aqueles com valores do pé quadrado muito acima da média da cidade ou que estão localizados em cidades que não estão entre as 10 mais populosas dos Estados Unidos, como Vashon e North Bend. Além disso, esses imóveis possuem tamanho do terreno menor que a média da cidade, número de quartos menor que a média da cidade e número de banheiros menor que a média da cidade, o que contribuiu para que esses imóveis recebessem notas baixas no algoritmo de ranqueamento.\n\n## Implantação:\nPara obtermos uma análise mais precisa, é necessário definir qual é o objetivo da compra do imóvel: revenda, aluguel ou uso próprio. Além disso, é importante identificar o público-alvo, como casais sem filhos, casais com filhos, solteiros ou estudantes. Também é necessário definir o tipo de imóvel desejado, se é de alto padrão ou popular, e qual o valor máximo do investimento.\n\nEm relação aos dados, seria mais simples se tivéssemos acesso ao valor do metro quadrado por cidade. É importante observar se os imóveis recomendados estão bem localizados, por exemplo, se há escolas próximas e se estão próximos ao centro da cidade, entre outros fatores.\n\n## Conclusão:\n### Os 5 recomendados:\n1. \u003e **O imóvel de ID: 2144800146** está localizado em Seattle, sendo vendido por $257500.0 com valor do pé quadrado de $27.587315191772017, tamanho do terreno de 9334, 3 quarto(s) e 2 banheiro(s), com área habitável de 1300.\n2. \u003e **O imóvel de ID: 3348401382** está localizado em Seattle, sendo vendido por $318000.0 com valor do pé quadrado de $25.11451587426947, tamanho do terreno de 12662, 3 quarto(s) e 2 banheiro(s), com área habitável de 1690.\n3. \u003e **O imóvel de ID: 2826049260** está localizado em Seattle, sendo vendido por $482500.0 com valor do pé quadrado de $63.270390768423816, tamanho do terreno de 7626, 4 quarto(s) e 3 banheiro(s), com área habitável de 1630.\n4. \u003e **O imóvel de ID: 4022902715** está localizado em Seattle, sendo vendido por $525000.0 com valor do pé quadrado de $51.08494696895981, tamanho do terreno de 10277, 5 quarto(s) e 3 banheiro(s), com área habitável de 2480.\n5. \u003e **O imóvel de ID: 5067400032** está localizado em Seattle, sendo vendido por $550000.0 com valor do pé quadrado de $38.19444444444444, tamanho do terreno de 14400, 3 quarto(s) e 2 banheiro(s), com área habitável de 3070.\n\n### Os 5 que **NÃO** recomendados:\n1. \u003e **O imóvel de ID: 3523029059** está localizado em Vashon, sendo vendido por $181000.0 com valor do pé quadrado de $16.748403812343852, tamanho do terreno de 10807, 2 quarto(s) e 1 banheiro(s), com área habitável de 1560.\n2. \u003e **O imóvel de ID: 913000340** está localizado em Seattle, sendo vendido por $252000.0 com valor do pé quadrado de $153.84615384615384, tamanho do terreno de 1638, 1 quarto(s) e 1 banheiro(s), com área habitável de 680.\n3. \u003e **O imóvel de ID: 9407110710** está localizado em North Bend, sendo vendido por $322000.0 com valor do pé quadrado de $38.333333333333336, tamanho do terreno de 8400, 3 quarto(s) e 1 banheiro(s), com área habitável de 1510.\n4. \u003e **O imóvel de ID: 2028700265** está localizado em Seattle, sendo vendido por $505000.0 com valor do pé quadrado de $132.33752620545073, tamanho do terreno de 3816, 2 quarto(s) e 1 banheiro(s), com área habitável de 1310.\n5. \u003e **O imóvel de ID: 4083802195** está localizado em Seattle, sendo vendido por $578888.0 com valor do pé quadrado de $144.722, tamanho do terreno de 4000, 2 quarto(s) e 2 banheiro(s), com área habitável de 1060.\n\n\n## Ambiente virtual e Dependências:\nCriando ambiente virtual:\n```\npython3 -m venv core/.venv\n```\n\nEntrando no ambiente virtual:\n```\nsource core/.venv/bin/activate\n```\n\nInstale as dependências:\n```\npip install -r core/requirements.txt\n```\n---\nLinkedin: \u003chttps://www.linkedin.com/in/samuel-barbosa-dev/\u003e \n\nE-mail: \u003csamueloficial@protonmail.com\u003e","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fsamuelbarbosadev%2Froof_imoveis_data_analysis","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fsamuelbarbosadev%2Froof_imoveis_data_analysis","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fsamuelbarbosadev%2Froof_imoveis_data_analysis/lists"}