Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/lucasfogliarini/minhaentradacrawler.consoleapp

Web crawler em C# que usa a biblioteca AngleSharp para extrair detalhes de eventos do site "https://minhaentrada.com.br". Ele analisa o HTML da página e recupera informações como título, data, local e links dos eventos.
https://github.com/lucasfogliarini/minhaentradacrawler.consoleapp

anglesharp crawler minhaentrada

Last synced: about 1 month ago
JSON representation

Web crawler em C# que usa a biblioteca AngleSharp para extrair detalhes de eventos do site "https://minhaentrada.com.br". Ele analisa o HTML da página e recupera informações como título, data, local e links dos eventos.

Awesome Lists containing this project

README

        

## O que é isso, GPT?

Isso é um web crawler escrito em C#. Ele é usado para extrair informações de eventos de um site específico, no caso, o site "https://minhaentrada.com.br". O código utiliza a biblioteca AngleSharp para fazer a análise do DOM (Document Object Model) da página HTML e extrair os detalhes dos eventos listados.

Vou explicar um pouco sobre cada parte do código:

1. **Classe `MinhaEntradaCrawler`**: Esta é a classe principal do código. Ela contém um construtor que recebe o nome do organizador de eventos como parâmetro e cria o URL para a agenda do organizador. A classe também tem um método `CrawlEventsAsync` que aceita uma data de início e uma data de término como parâmetros e retorna uma lista de eventos que ocorrem dentro desse intervalo de datas.

2. **Método `GetHtmlDocumentAsync`**: Este método é responsável por obter o conteúdo HTML da página usando a classe `HttpClient`, e em seguida, cria um documento HTML com a ajuda da biblioteca AngleSharp. Ele configura um objeto `BrowsingContext` que é usado para carregar o HTML e criar um documento DOM.

3. **Método `ExtractEvents`**: Neste método, o DOM da página é analisado para extrair as informações dos eventos. Ele utiliza seletores CSS para encontrar os elementos relevantes na página HTML, como títulos, datas, locais, URLs de imagem e links para os eventos. As informações são extraídas e usadas para criar objetos do tipo `Event`, que são então adicionados a uma lista.

ChatGPT Version:
https://help.openai.com/en/articles/6825453-chatgpt-release-notes