{"id":26517528,"url":"https://github.com/ryansakurai/artigo-deep-web","last_synced_at":"2025-07-22T13:33:58.657Z","repository":{"id":117645463,"uuid":"563915269","full_name":"ryansakurai/artigo-deep-web","owner":"ryansakurai","description":"Artigo com o objetivo de desmisticar e explicar os conceitos de Deep Web, Dark Web e Surface Web, feito para a Revista HackoonSpace 2022","archived":false,"fork":false,"pushed_at":"2022-11-24T23:59:31.000Z","size":1066,"stargazers_count":0,"open_issues_count":0,"forks_count":1,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-03-21T08:32:29.551Z","etag":null,"topics":["article","dark-web","deep-web","tor","web"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/ryansakurai.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2022-11-09T15:50:23.000Z","updated_at":"2024-01-27T13:04:22.000Z","dependencies_parsed_at":null,"dependency_job_id":"8d508476-ae37-4c19-b24a-32604d01958f","html_url":"https://github.com/ryansakurai/artigo-deep-web","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/ryansakurai/artigo-deep-web","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/ryansakurai%2Fartigo-deep-web","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/ryansakurai%2Fartigo-deep-web/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/ryansakurai%2Fartigo-deep-web/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/ryansakurai%2Fartigo-deep-web/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/ryansakurai","download_url":"https://codeload.github.com/ryansakurai/artigo-deep-web/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/ryansakurai%2Fartigo-deep-web/sbom","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":266506174,"owners_count":23940019,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","status":"online","status_checked_at":"2025-07-22T02:00:09.085Z","response_time":66,"last_error":null,"robots_txt_status":null,"robots_txt_updated_at":null,"robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["article","dark-web","deep-web","tor","web"],"created_at":"2025-03-21T08:27:32.309Z","updated_at":"2025-07-22T13:33:58.649Z","avatar_url":"https://github.com/ryansakurai.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"# Deep Web: além da superfície\r\n\r\n## Resumo\r\nMuito popular entre canais de curiosidade e teorias da conspiração no Youtube, Deep Web é um conceito cercado de mitos, desinformação e sensacionalismo. Visto isso, o objetivo deste artigo é desmistificar e explicar o que de fato é a Deep Web e o que a diferencia da “web normal”.\r\n\r\n## Introdução\r\nApesar dos termos internet e web serem frequentemente utilizados intercambiavelmente, eles não são sinônimos. Por isso, antes de mais nada, é importante diferenciá-los.\r\n\r\nA internet é uma rede que conecta computadores, servidores e outros aparelhos em escala global, além da infraestrutura por trás dessa rede. Sua criação data em meados da década de 1970 e ela possibilita o transporte de informações no mundo contemporâneo e tecnologias como a web.\r\n\r\nPor sua vez, a web - também conhecida como World Wide Web (WWW) -  é um sistema de compartilhamento de informações através da internet criado na década de 1980. Ela é um conjunto de arquivos que podem ser visualizados através de um navegador, como o Google Chrome, o Mozilla Firefox, o defunto Internet Explorer e seu substituto Microsoft Edge.\r\n\r\n![internet vs web](img/internet_vs_web.jpg)\r\n\r\n*[Diferença entre internet e web](https://www.computerhistory.org/revolution/networking/19/314)*\r\n\r\nO compartilhamento de informações na web é feito através da HyperText Markup Language (HTML), uma linguagem de marcação que, por sua vez, funciona sob os princípios de hipertexto e hipermídia. Hipertexto define o conceito de texto não linear, ou seja, que possui link para outros textos, e hipermídia consiste na coexistência de texto, vídeos, imagens e outras formas de conteúdo na mesma página.\r\n\r\n![hipertexto](img/hipertexto.png)\r\n\r\n*[Hipertexto](https://en.wikipedia.org/wiki/Hypertext)*\r\n\r\nTendo isso em vista, a web possui 3 principais camadas: a Surface Web, a Deep Web e a Dark Web, que vão ser apresentadas a seguir.\r\n\r\n## Surface Web\r\nA primeira camada da web, a Surface Web, é a parte da web formada por páginas que podem ser encontradas e acessadas através de mecanismos de busca como Google e Bing. O que torna essas páginas disponíveis é a ação de algoritmos chamados web crawlers.\r\n\r\nWeb crawlers são os algoritmos dos mecanismos de busca responsáveis por fazer a indexação das páginas da web. Esses bots inspecionam seus códigos HTML procurando por dados sobre a página, as indexam e as classificam com base nesses dados. Dessa maneira, quando um usuário faz uma pesquisa no Google, ele encontra os resultados que o mecanismo julga serem mais relevantes.\r\n\r\n![web crawler](img/indexacao.png)\r\n\r\n*[Indexação feita por mecanismos de busca](https://computersciencewiki.org/index.php/Web-indexing)*\r\n\r\n## Deep Web\r\nA segunda camada da web, a Deep Web, em oposição à Surface Web, é a parte da web composta por páginas que não podem ser acessadas através de mecanismos de busca, ou seja, que não foram indexadas. A maior parte dessas páginas utilizam as mesmas tecnologias da Surface Web e, apesar de dificuldades no cálculo de seu tamanho, a Deep Web compõe a esmagadora maioria da web.\r\n\r\nOs motivos para a não indexação das páginas da Deep Web podem ser diversos: necessidade de autenticação ou pagamento, uso de outros protocolos que não sejam HTTP/HTTPS, conteúdo gerado dinamicamente, dificuldade em indexar mídia ou até falta de link entre uma página e outra. A indexação pode, inclusive, ser impedida de maneira voluntária por parte do criador do site, através do arquivo robots.txt, que diz aos web crawlers quais páginas não indexar.\r\n\r\n![robots.txt](img/robots_txt.png)\r\n\r\n*Screenshot do arquivo robots.txt do Facebook*\r\n\r\nExemplos de páginas que fazem parte da Deep Web são: conversas no WhatsApp Web, feed do Facebook, caixa de e-mails, salas virtuais do Google Meet, bancos de dados, jornais científicos, etc. Portanto, é equivocada a crença popular de que a Deep Web seja um lugar hostil e perigoso, formado majoritariamente por sites criminosos e visitado por hackers.\r\n\r\n## Dark Web\r\nPor último, a camada mais profunda da web é a Dark Web. Ela também é formada por páginas que não foram indexadas pelos sites de busca, ou seja, tecnicamente também faz parte da Deep Web. Porém, o fator que a diferencia do resto da Deep Web é que ela funciona usando como suporte as darknets, que são redes construídas em cima da internet que só podem ser acessadas com tecnologias ou configurações específicas. Apesar de existirem várias, a que está mais comumente associada à Dark Web é a rede Tor - The Onion Router.\r\n\r\nTor é uma rede descentralizada mantida por vários voluntários que usa uma técnica chamada onion routing para a transmissão de informações entre usuário e servidor, que consiste em passar o pacote por várias máquinas intermediárias, o envolvendo em várias camadas de criptografia. Pode ser feita uma analogia entre essas camadas com as de uma cebola, que é de onde se origina o termo onion routing.\r\n\r\nNo envio de pacote do cliente ao servidor, primeiramente, o dado é encriptado três vezes e encaminhado à primeira máquina, chamada de nó guarda. Essa máquina irá tirar uma camada de criptografia e encaminhar o pacote à máquina intermediária, que, por sua vez, removerá mais uma camada de criptografia e o enviará ao chamado nó de saída. Após a terceira camada de criptografia ser removida, o dado finalmente será encaminhado pelo nó de saída e chegará ao seu destino.\r\n\r\n![criptografia do tor](img/tor_camadas.jpg)\r\n\r\n*[A criptografia da rede TOR](https://1technation.com/tech-savvy-dark-side-onion-router/)*\r\n\r\nA volta do pacote (sentido servidor-cliente) é feita da maneira inversa. Primeiro o dado é enviado sem nenhuma das camadas de criptografia do Tor (pode ser que o dado já tenha sido encriptado antes de passar pela rede) ao nó de saída, que irá adicionar a primeira. Após isso, será adicionada uma camada de criptografia por máquina, até que o dado seja enviado do nó guarda até o cliente, que removerá as três camadas de uma vez.\r\n\r\nA anonimidade nesse sistema se deve ao fato de que um nó conhece apenas o IP do nó anterior e o do nó posterior. Por isso, com exceção do guarda, nenhum dos nós ou o servidor conhecem o IP do cliente, e vice-versa.\r\n\r\nOs sites hospedados na rede Tor costumam ter a extensão .onion e podem ser acessados facilmente através do navegador Tor, que também pode ser usado para acessar sites da Surface Web, apesar de vários deles impedirem acesso através da rede onion.\r\n\r\n![processo do tor](img/tor_rede.png)\r\n\r\n*[Processo de onion routing](https://www.bbc.com/news/technology-30637010)*\r\n\r\nPor causa da anonimidade provida pela Dark Web, ela muitas vezes é palco de atividades ilegais, como: pornografia ilegal, mercado ilegal, contrato de serviço de hackers, etc. Dito isso, seu acesso não é seguro e não compensa ser feito, se não houver um motivo específico para isso. Apesar disso, a Dark Web não é completamente negativa, pois também permite combater a censura em regimes totalitários e facilitar a ação de whistleblowers, por exemplo.\r\n\r\n## Conclusão\r\nAtravés deste artigo, conclui-se que apesar do uso intercambiado entre web e internet, os dois conceitos são diferentes, sendo a web dividida em camadas de acesso. Além disso, é errado dizer que a Deep Web é uma rede usada majoritariamente por criminosos, pois esse tipo de atividade se concentra em parte da Dark Web, uma subcamada minoritária da Deep Web. Por conta de sua privacidade e anonimato, ela é uma ferramenta que pode muitas vezes ser usada de maneira benigna, porém ainda é insegura e carregada de ilegalidade e perigos. Portanto, ela não deve ser acessada por pessoas leigas e que não tem um bom motivo para acessá-la.\r\n\r\n## Bibliografia\r\n1. [Internet vs. Web: What's the Difference?](https://www.lifewire.com/difference-between-the-internet-and-the-web-2483335)\r\n2. [A Brief History of the Internet](https://www.usg.edu/galileo/skills/unit07/internet07_02.phtml)\r\n3. [Who Invented the Internet? - HISTORY](https://www.history.com/news/who-invented-the-internet)\r\n4. [What is the Web? - Definition from Techopedia](https://www.techopedia.com/definition/5613/web)\r\n5. [What is Hypertext?](https://www.w3.org/WhatIs.html)\r\n6. [What is the Deep Web and What Will You Find There?](https://www.techtarget.com/whatis/definition/deep-Web)\r\n7. [Is the Dark Web Dangerous? What you need to know](https://www.kaspersky.com/resource-center/threats/deep-web)\r\n8. [What is a web crawler? | How web spiders work | Cloudflare](https://www.cloudflare.com/learning/bots/what-is-a-web-crawler/)\r\n9. [Web Crawler: Entenda o Que é, Quando Usar e Como Funciona](https://neilpatel.com/br/blog/web-crawler/)\r\n10. [Going Dark: The Internet Behind The Internet : All Tech Considered : NPR](https://www.npr.org/sections/alltechconsidered/2014/05/25/315821415/going-dark-the-internet-behind-the-internet)\r\n11. [What is Tor and how does it work? | TechRadar](https://www.techradar.com/vpn/what-is-tor-and-how-does-it-work)\r\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fryansakurai%2Fartigo-deep-web","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fryansakurai%2Fartigo-deep-web","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fryansakurai%2Fartigo-deep-web/lists"}