https://github.com/danielpaez-dev/web-scraping-project-tutorial
https://github.com/danielpaez-dev/web-scraping-project-tutorial
Last synced: 5 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/danielpaez-dev/web-scraping-project-tutorial
- Owner: danielpaez-dev
- Created: 2025-06-20T18:08:41.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2025-06-20T19:24:44.000Z (about 1 year ago)
- Last Synced: 2025-06-20T20:42:50.966Z (about 1 year ago)
- Language: Jupyter Notebook
- Size: 1.31 MB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.es.md
Awesome Lists containing this project
README
# Web scraping con Python - Guía paso a paso
- Familiarizarse con un entorno web en el que se desea extraer cierta información.
- Desarrollar un código para obtener su contenido y extraerlo de una tabla concreta.
- Utilizar una base de datos para almacenar los datos y procesarlos.
## 🌱 Cómo iniciar este proyecto
Sigue las siguientes instrucciones:
1. Crear un nuevo repositorio haciendo fork en el [proyecto de Git](https://github.com/4geeksacademy/web-scraping-project-tutorial) o [haciendo clic aquí](https://github.com/4geeksacademy/web-scraping-project-tutorial/fork).
2. Abre el repositorio creado recientemente en Codespace usando la [extensión del botón de Codespace](https://docs.github.com/es/codespaces/developing-in-a-codespace/creating-a-codespace-for-a-repository#creating-a-codespace-for-a-repository).
3. Una vez que el VSCode del Codespace haya terminado de abrirse, comienza tu proyecto siguiendo las instrucciones a continuación.
## 📝 Instrucciones
1. **Lee el archivo `./INSTRUCTIONS.es.md`** para conocer los pasos detallados del proyecto.
2. **Desarrolla tu solución en `./src/explore.ipynb`**. Cuando estes en el archivo `./src/explore.ipynb`, asegúrate de **seleccionar el kernel adecuado**. Al abrir el notebook, aparecerá un mensaje en la parte superior indicando **"Select Kernel"**. Haz clic en **"Select Kernel"** (como se muestra en la imagen).

Se mostrará una lista con las opciones disponibles. Selecciona **"Python Environments"** y elige la versión de Python que deseas utilizar. Asegúrate de seleccionar la versión especificada en el archivo `devcontainer.json`, ya que esta es la recomendada para el proyecto.

3. **Transfiere el código limpio a `./src/app.py`** una vez que hayas terminado las pruebas.
4. **Elimina `./src/explore.ipynb`** después de asegurarte de que ya no lo necesitas. Esto mantendrá el proyecto limpio y organizado.
¡Sigue estos pasos y avanza con el proyecto de manera estructurada! 🚀
> Nota: También incorporamos muestras de solución en `./src/solution.ipynb` que te sugerimos honestamente que solo uses si estás atascado por más de 30 minutos o si ya has terminado y quieres compararlo con tu enfoque.
## 🚛 Cómo entregar este proyecto
Una vez que hayas terminado de resolver los ejercicios, asegúrate de confirmar tus cambios, haz `push` a tu repositorio y ve a 4Geeks.com para subir el enlace del repositorio.