{"id":19250285,"url":"https://github.com/breakingtechfr/trie-urls-breakingtech","last_synced_at":"2026-06-16T08:31:17.282Z","repository":{"id":253971963,"uuid":"845063677","full_name":"BreakingTechFr/Trie-urls-BreakingTech","owner":"BreakingTechFr","description":"Cette application Python est un outil de comparaison d'URLs qui permet de traiter efficacement deux fichiers .txt contenant des listes d'URLs. Elle est particulièrement utile pour identifier les nouvelles URLs qui ne sont pas présentes dans un fichier existant.","archived":false,"fork":false,"pushed_at":"2024-11-07T10:05:57.000Z","size":8,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-02-23T16:34:25.790Z","etag":null,"topics":["python","seo","url"],"latest_commit_sha":null,"homepage":"https://www.breakingtech.fr","language":"Python","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/BreakingTechFr.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-08-20T14:06:22.000Z","updated_at":"2024-11-07T10:06:00.000Z","dependencies_parsed_at":null,"dependency_job_id":"69fd4f5a-c266-411d-8c44-79ebbbf7665c","html_url":"https://github.com/BreakingTechFr/Trie-urls-BreakingTech","commit_stats":null,"previous_names":["breakingtechfr/trie-urls-breakingtech"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/BreakingTechFr/Trie-urls-BreakingTech","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/BreakingTechFr%2FTrie-urls-BreakingTech","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/BreakingTechFr%2FTrie-urls-BreakingTech/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/BreakingTechFr%2FTrie-urls-BreakingTech/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/BreakingTechFr%2FTrie-urls-BreakingTech/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/BreakingTechFr","download_url":"https://codeload.github.com/BreakingTechFr/Trie-urls-BreakingTech/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/BreakingTechFr%2FTrie-urls-BreakingTech/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":34398405,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-05-26T15:22:16.424Z","status":"online","status_checked_at":"2026-06-16T02:00:06.860Z","response_time":126,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["python","seo","url"],"created_at":"2024-11-09T18:16:42.018Z","updated_at":"2026-06-16T08:31:17.266Z","avatar_url":"https://github.com/BreakingTechFr.png","language":"Python","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Trie-urls-BreakingTech\n\n![Capture d’écran 2024-08-20 à 16 08 01](https://github.com/user-attachments/assets/a32d7bed-84c4-4adf-9aca-51fed7aed841)\n\nCette application Python est un outil de comparaison d'URLs qui permet de traiter efficacement deux fichiers .txt contenant des listes d'URLs. Elle est particulièrement utile pour identifier les nouvelles URLs qui ne sont pas présentes dans un fichier existant.\n\n# Installation :\n- Installez les dépendances avec la commande :\n```shell![Capture d’écran 2024-08-19 à 09 19 09](https://github.com/user-attachments/assets/3a408e51-26b6-4ec0-9738-cd11918b4f17)\npip install requirements.txt\n```\n- Lancez le fichier trie.py en utilisant la commande :\n```shell\npython trie.py\n```\n\n# Fonctionnalités :\nNettoyage automatique des URLs : Avant la comparaison, l'application nettoie automatiquement chaque URL des fichiers en supprimant les préfixes www., http://, https://, https://www., ou http://www.. De plus, si une URL se termine par un caractère /, celui-ci est également supprimé pour assurer une comparaison correcte.\n\nComparaison d'URLs : L'application compare les deux fichiers .txt après nettoyage des URLs et extrait les URLs qui sont présentes uniquement dans le premier fichier (c'est-à-dire les nouvelles URLs qui ne sont pas déjà dans le second fichier).\n\nGénération d'un fichier de résultats : Les résultats de la comparaison sont automatiquement sauvegardés dans un fichier nommé trie-des-deux-fichiers.txt, qui contient toutes les URLs uniques du premier fichier.\n\n# Utilisation :\nGlisser-déposer des fichiers : L'utilisateur est invité à glisser-déposer les fichiers .txt contenant les listes d'URLs dans le terminal. Le premier fichier doit contenir les nouvelles URLs à analyser, et le second fichier doit contenir les URLs déjà existantes.\n\nNettoyage et comparaison : Le programme nettoie les URLs des deux fichiers avant de procéder à la comparaison pour s'assurer que les URLs sont dans un format cohérent.\n\nRésultat : Les URLs qui sont présentes dans le premier fichier mais absentes du second sont sauvegardées dans un fichier trie-des-deux-fichiers.txt, créé automatiquement dans le répertoire courant.\n\n# Exemple d'utilisation :\nSupposons que vous ayez deux fichiers :\n\nnouvelles_urls.txt : Contient une liste d'URLs à vérifier.\nurls_existantes.txt : Contient une liste d'URLs déjà existantes.\nEn utilisant l'application, vous pourrez identifier rapidement toutes les nouvelles URLs présentes dans nouvelles_urls.txt qui ne sont pas dans urls_existantes.txt.\n\n\n## Suivez-nous\n\n- [@breakingtechfr](https://twitter.com/BreakingTechFR) sur Twitter.\n- [Facebook](https://www.facebook.com/BreakingTechFr/) likez notre page.\n- [Instagram](https://www.instagram.com/breakingtechfr/) taguez nous sur vos publications !\n- [Discord](https://discord.gg/VYNVBhk) pour parler avec nous !\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fbreakingtechfr%2Ftrie-urls-breakingtech","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fbreakingtechfr%2Ftrie-urls-breakingtech","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fbreakingtechfr%2Ftrie-urls-breakingtech/lists"}