https://github.com/pcanadas/weather_scraper
Este proyecto automatiza la recopilación y el procesamiento de datos meteorológicos históricos y previsionales. Utiliza Selenium para extraer información de sitios web de clima, procesa los datos con Pandas y los almacena en archivos CSV limpios. Es ideal para análisis climáticos, visualización de datos o integración en otros sistemas.
https://github.com/pcanadas/weather_scraper
beautifulsoup data-analysis pandas python selenium
Last synced: about 2 months ago
JSON representation
Este proyecto automatiza la recopilación y el procesamiento de datos meteorológicos históricos y previsionales. Utiliza Selenium para extraer información de sitios web de clima, procesa los datos con Pandas y los almacena en archivos CSV limpios. Es ideal para análisis climáticos, visualización de datos o integración en otros sistemas.
- Host: GitHub
- URL: https://github.com/pcanadas/weather_scraper
- Owner: pcanadas
- License: mit
- Created: 2025-02-12T09:34:08.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2025-02-18T10:25:19.000Z (over 1 year ago)
- Last Synced: 2025-04-13T13:38:58.630Z (about 1 year ago)
- Topics: beautifulsoup, data-analysis, pandas, python, selenium
- Language: Python
- Homepage:
- Size: 314 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Weather Scraper
Este proyecto automatiza la recopilación y el procesamiento de datos meteorológicos históricos y previsionales. Utiliza Selenium y BeautifulSoup para extraer información de sitios web de clima, procesa los datos con Pandas y los almacena en archivos CSV limpios. Es ideal para análisis climáticos, visualización de datos o integración en otros sistemas.
## Archivos principales
*links_clima.py*
Este archivo genera una lista de enlaces a datos climáticos históricos desde una fuente específica y los guarda en un archivo de texto.
*proceso_clima.py*
Este archivo lee las URLs generadas en links_clima.py, accede a cada una con Selenium, extrae la información relevante sobre el clima con BeautifulSoup y la almacena en formato CSV para su posterior análisis.
*limpieza_clima.py*
Este script se encarga de limpiar y estructurar los datos crudos extraídos con el archivo proceso_clima.py. Realiza las siguientes tareas:
- Separa el título en ciudad y fecha.
- Extrae información de temperatura, precipitación, viento y humedad.
- Genera un DataFrame limpio y lo guarda en limpio/clima_limpio.csv para su análisis posterior.
*links_prevision.py*
Este archivo genera una lista de enlaces a datos de previsión climática desde una fuente específica y los guarda en un archivo de texto.
*proceso_prevision.py*
Este archivo lee las URLs generadas en links_prevision.py, accede a cada una con Selenium, extrae la información relevante sobre el clima con BeautifulSoup y la almacena en formato CSV para su posterior análisis.
*limpieza_prevision.py*
Este script se encarga de limpiar y estructurar los datos crudos extraídos con el archivo proceso_prevision.py. Realiza las siguientes tareas:
- Extrae información de ciudad, fecha de recolección de datos, fecha de la previsión, temperaturas máxima y mínima, clima esperado y viento.
- Genera un DataFrame limpio y lo guarda en limpio/pronostico.csv, incluyendo la fecha de extracción de los datos para su análisis posterior.
## Requisitos
- Python 3
- Selenium
- BeautifulSoup
- Pandas
## Uso
Ejecutar los notebooks en el orden indicado para obtener y procesar los datos climáticos.