https://github.com/valentina17varela/argentine_culture_data_integration
Argentinean cultural database (libraries, museums and movie theaters)
https://github.com/valentina17varela/argentine_culture_data_integration
pandas-python postgresql postgresql-database python python-app sqlalchemy-python webscraping
Last synced: 3 months ago
JSON representation
Argentinean cultural database (libraries, museums and movie theaters)
- Host: GitHub
- URL: https://github.com/valentina17varela/argentine_culture_data_integration
- Owner: Valentina17varela
- Created: 2022-07-24T03:26:17.000Z (almost 3 years ago)
- Default Branch: main
- Last Pushed: 2022-07-24T04:19:19.000Z (almost 3 years ago)
- Last Synced: 2024-12-05T05:08:50.464Z (7 months ago)
- Topics: pandas-python, postgresql, postgresql-database, python, python-app, sqlalchemy-python, webscraping
- Language: Python
- Homepage:
- Size: 29.1 MB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# DATA ANALYTICS + PYTHON






Proyecto que consume datos de 3 fuentes distintas para popular una base de datos con informacion cultural sobre bibliotecas, museos y salas de cines argentinos.
Para mas informacion ver documento [Challenge Alkemy](https://github.com/Valentina17varela/Alkemy/blob/main/Challenge%20Data%20Analytics%20con%20Python.pdf)## Deploy
- Clonar el siguiente repositorio
```
git clone https://github.com/Valentina17varela/Alkemy.git
```- Crear el entorno virtual y activarlo
- Windows:
```
py -m venv env
.\env\Scripts\activate
```
- Unix/macOS:
```
python3 -m venv env
source env/bin/activate
```- Instalar las dependencias necesarias
```
pip install -r requirements.txt
```- Configurar los parametros para conectarse a la base de datos, en el archivo ```.env``` reemplazar el valor de las variables globales con la informacion correspondiente
```
POSTGRES_HOST=
POSTGRES_PORT=
POSTGRES_PASSWORD=
POSTGRES_USER=
POSTGRES_DB=
```> Si las url's de las fuentes han cambiado reemplazar su valor en las variables que se encuentran en ```.env```
## Ejecucion
Para dar inicio al programa ejecutar el archivo ```main.py```
## Implementacion
- main.py: Es el archivo principal donde ocurre la descarga y procesamiento de datos.
- userInterface.py: Le informa al usuario el momento en el que se encuentra el programa.
- dataCollector.py: Descarga la informacion correspondiente de las fuentes y procesa la informacion en tablas.
- baseDatos.py: Carga las tablas de informacion a la base de datos.