https://github.com/itsabdessalam/web-parser
:open_file_folder: Web Parser C#
https://github.com/itsabdessalam/web-parser
console csharp dotnet html web-parser
Last synced: 3 months ago
JSON representation
:open_file_folder: Web Parser C#
- Host: GitHub
- URL: https://github.com/itsabdessalam/web-parser
- Owner: itsabdessalam
- Created: 2017-10-23T07:26:55.000Z (over 7 years ago)
- Default Branch: master
- Last Pushed: 2019-09-25T05:06:48.000Z (over 5 years ago)
- Last Synced: 2025-02-24T12:49:31.338Z (3 months ago)
- Topics: console, csharp, dotnet, html, web-parser
- Language: C#
- Homepage:
- Size: 171 KB
- Stars: 1
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Web Parser 
> Petit programme permettant de parser le code html d'une Page

## Objectif
Utiliser les notions vues en cours, à savoir : les fonctions, les collections, streams,...
## Instructions
1. Récuperer le code html d'une page à partir de son url dans un fichier ```.txt```
2. Passer le fichier en lecture et renommez la page ainsi que la src des images
3. Mettre tous les textes en gras
4. Supprimer tous les scripts javascript
5. Faire une recherche dans le texte du mot qui a le plus d'occurences## Execution du programme
Ce projet a été réalisé sur Archlinux en utilisant Visual Studio Code
### Linux
Si vous êtes sous Linux vérifiez que vous avez ces paquets installés
* dotnet-host
* dotnet-runtime-2.0
* dotnet-sdk-2.0Ensuite deplacez vous dans le dossier contenant le projet et lancez la commande :
dotnet run
### Windows
Si vous êtes sous Windows ouvrez le dossier avec Visual Studio
L'ensemble des fichiers crées sera sur le Bureau
## Améliorations
Utilser HtmlAgilityPack pour plus de fonctionnalités
## Auteur
[Abdessalam BENHARIRA](https://abdessalam.dev)