https://github.com/mrroot5/link-url-scraping
Scraping de una URL introducida como parámetro para obtener todos los enlaces de la página introducida
https://github.com/mrroot5/link-url-scraping
Last synced: 6 months ago
JSON representation
Scraping de una URL introducida como parámetro para obtener todos los enlaces de la página introducida
- Host: GitHub
- URL: https://github.com/mrroot5/link-url-scraping
- Owner: mrroot5
- License: mit
- Created: 2016-01-08T19:17:55.000Z (over 10 years ago)
- Default Branch: master
- Last Pushed: 2016-04-15T09:43:23.000Z (about 10 years ago)
- Last Synced: 2025-02-26T21:45:09.942Z (over 1 year ago)
- Language: Python
- Size: 46.9 KB
- Stars: 0
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Descontinuado
# URL Scraping
Scraping de una URL para obtener todos los enlaces de la página introducida por parámetro y un parámetro opcional para seguir buscando enlaces dentro de la página en forma de árbol.
## Uso
Una vez desplazado a la ruta del fichero scraping.py lo ejecutamos con una URL (cambiar la de ejemplo por la deseada):
python scraping.py http://adriangarrido.com.es/prueba-enlaces 3
El parámetro numérico, "3" en el ejemplo, es opcional. Por defecto el programa solamente busca las URL de la página suministrada.
## Dependencias
* [python 27.7.11](https://www.python.org/downloads/)
* pip install beautifulsoup4.
* pip install requests
## Screenshot

## TODO
* Permitir el uso de URL relativas
* Permitir devolver los datos en otro formato
## Changelog
[Changelog](https://github.com/erknrio/link-url-scraping/releases)
## License
Programa baho la linecia MIT [`LICENSE`](LICENSE)