https://github.com/pcanadas/weather_scraper

Este proyecto automatiza la recopilación y el procesamiento de datos meteorológicos históricos y previsionales. Utiliza Selenium para extraer información de sitios web de clima, procesa los datos con Pandas y los almacena en archivos CSV limpios. Es ideal para análisis climáticos, visualización de datos o integración en otros sistemas.
https://github.com/pcanadas/weather_scraper

beautifulsoup data-analysis pandas python selenium

Last synced: 2 months ago
JSON representation

Host: GitHub
URL: https://github.com/pcanadas/weather_scraper
Owner: pcanadas
License: mit
Created: 2025-02-12T09:34:08.000Z (over 1 year ago)
Default Branch: main
Last Pushed: 2025-02-18T10:25:19.000Z (over 1 year ago)
Last Synced: 2025-04-13T13:38:58.630Z (over 1 year ago)
Topics: beautifulsoup, data-analysis, pandas, python, selenium
Language: Python
Homepage:
Size: 314 KB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

# Weather Scraper
Este proyecto automatiza la recopilación y el procesamiento de datos meteorológicos históricos y previsionales. Utiliza Selenium y BeautifulSoup para extraer información de sitios web de clima, procesa los datos con Pandas y los almacena en archivos CSV limpios. Es ideal para análisis climáticos, visualización de datos o integración en otros sistemas.

## Archivos principales

*links_clima.py*

Este archivo genera una lista de enlaces a datos climáticos históricos desde una fuente específica y los guarda en un archivo de texto.

*proceso_clima.py*

Este archivo lee las URLs generadas en links_clima.py, accede a cada una con Selenium, extrae la información relevante sobre el clima con BeautifulSoup y la almacena en formato CSV para su posterior análisis.

*limpieza_clima.py*

Este script se encarga de limpiar y estructurar los datos crudos extraídos con el archivo proceso_clima.py. Realiza las siguientes tareas:

- Separa el título en ciudad y fecha.

- Extrae información de temperatura, precipitación, viento y humedad.

- Genera un DataFrame limpio y lo guarda en limpio/clima_limpio.csv para su análisis posterior.

*links_prevision.py*

Este archivo genera una lista de enlaces a datos de previsión climática desde una fuente específica y los guarda en un archivo de texto.

*proceso_prevision.py*

Este archivo lee las URLs generadas en links_prevision.py, accede a cada una con Selenium, extrae la información relevante sobre el clima con BeautifulSoup y la almacena en formato CSV para su posterior análisis.

*limpieza_prevision.py*

Este script se encarga de limpiar y estructurar los datos crudos extraídos con el archivo proceso_prevision.py. Realiza las siguientes tareas:

- Extrae información de ciudad, fecha de recolección de datos, fecha de la previsión, temperaturas máxima y mínima, clima esperado y viento.

- Genera un DataFrame limpio y lo guarda en limpio/pronostico.csv, incluyendo la fecha de extracción de los datos para su análisis posterior.

## Requisitos

- Python 3

- Selenium

- BeautifulSoup

- Pandas

## Uso

Ejecutar los notebooks en el orden indicado para obtener y procesar los datos climáticos.

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/pcanadas/weather_scraper

Awesome Lists containing this project

README