https://github.com/grazen0/proyecto-bd
https://github.com/grazen0/proyecto-bd
Last synced: 5 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/grazen0/proyecto-bd
- Owner: Grazen0
- License: mit
- Created: 2025-06-26T17:38:27.000Z (9 months ago)
- Default Branch: main
- Last Pushed: 2025-06-30T02:46:49.000Z (9 months ago)
- Last Synced: 2025-09-03T21:31:15.614Z (6 months ago)
- Language: Python
- Size: 13.7 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Proyecto BD
> [!NOTE]
> La data generada con los scripts, como es muy grande para subirla a GitHub, se encuentra en este [link de Drive](https://drive.google.com/drive/folders/160GlLABwiquvY-NyMvyWOhCZ1Y0HsvAt?usp=sharing). Habiendo descargado la data, el directorio local `data` debería verse así:
>
> ```
> data
> ├── manual/
> │ ├── 01-rarities.csv
> │ └── 02-element_types.csv
> └── generated/
> ├── 1k/
> │ └── ...
> ├── 10k/
> │ └── ...
> ├── 100k/
> │ └── ...
> └── 1000k/
> └── ...
> ...
> ```
Este repo tiene una configuración de Docker Compose para iniciar un contenedor de PostgreSQL con un volumen configurado de `data/` a `/data`. Se puede iniciar con este comando:
```bash
docker compose up -d
```
La creación inicial, generación de datos y carga de los datos se hace con los scripts en `src/`. Porsiaca, incluimos un script `run_all.sh` que corre todo en orden.
El repo también incluye un `shell.nix` para reproducir el entorno de Python y PostgreSQL necesario para correr los scripts.
TLDR: Al final, esta secuencia de comandos debería funcionar:
```bash
nix-shell
docker compose up -d
./run_all.sh
```
PERO si descargas la data del [link de Drive de arriba](https://drive.google.com/drive/folders/160GlLABwiquvY-NyMvyWOhCZ1Y0HsvAt?usp=sharing), puedes simplemente correr los scripts 1 y 3:
```bash
python src/1_init.py
python src/3_populate.py
```