An open API service indexing awesome lists of open source software.

https://github.com/grazen0/proyecto-bd


https://github.com/grazen0/proyecto-bd

Last synced: 5 months ago
JSON representation

Awesome Lists containing this project

README

          

# Proyecto BD

> [!NOTE]
> La data generada con los scripts, como es muy grande para subirla a GitHub, se encuentra en este [link de Drive](https://drive.google.com/drive/folders/160GlLABwiquvY-NyMvyWOhCZ1Y0HsvAt?usp=sharing). Habiendo descargado la data, el directorio local `data` debería verse así:
>
> ```
> data
> ├── manual/
> │ ├── 01-rarities.csv
> │ └── 02-element_types.csv
> └── generated/
> ├── 1k/
> │ └── ...
> ├── 10k/
> │ └── ...
> ├── 100k/
> │ └── ...
> └── 1000k/
> └── ...
> ...
> ```

Este repo tiene una configuración de Docker Compose para iniciar un contenedor de PostgreSQL con un volumen configurado de `data/` a `/data`. Se puede iniciar con este comando:

```bash
docker compose up -d
```

La creación inicial, generación de datos y carga de los datos se hace con los scripts en `src/`. Porsiaca, incluimos un script `run_all.sh` que corre todo en orden.

El repo también incluye un `shell.nix` para reproducir el entorno de Python y PostgreSQL necesario para correr los scripts.

TLDR: Al final, esta secuencia de comandos debería funcionar:

```bash
nix-shell
docker compose up -d
./run_all.sh
```

PERO si descargas la data del [link de Drive de arriba](https://drive.google.com/drive/folders/160GlLABwiquvY-NyMvyWOhCZ1Y0HsvAt?usp=sharing), puedes simplemente correr los scripts 1 y 3:

```bash
python src/1_init.py
python src/3_populate.py
```