https://github.com/adriacabeza/gan-workshop

:robot: Introducción a las Redes Generativas Adversarias
https://github.com/adriacabeza/gan-workshop

Last synced: 7 months ago
JSON representation

:robot: Introducción a las Redes Generativas Adversarias

Host: GitHub
URL: https://github.com/adriacabeza/gan-workshop
Owner: adriacabeza
License: mit
Created: 2020-04-15T09:31:08.000Z (over 5 years ago)
Default Branch: master
Last Pushed: 2020-04-18T14:44:10.000Z (over 5 years ago)
Last Synced: 2024-07-31T20:47:16.863Z (about 1 year ago)
Language: Jupyter Notebook
Homepage:
Size: 7.36 MB
Stars: 3
Watchers: 4
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

          
 Introducción a las Redes Generativas Adversarias :robot:  + Autocolorizador 🌈 


[![HitCount](http://hits.dwyl.io/adriacabeza/GAN-workshop.svg)](http://hits.dwyl.io/adriacabeza/GAN-workshop)[![contributions welcome](https://img.shields.io/badge/contributions-welcome-brightgreen.svg?style=flat)](https://github.com/adriacabeza/GAN-Workshop)[![GitHub stars](https://img.shields.io/github/stars/adriacabeza/GAN-Workshop.svg)](https://GitHub.com/adriacabeza/GAN-Workshop/stargazers/)[![GitHub repo size in bytes](https://img.shields.io/github/repo-size/adriacabeza/GAN-Workshop.svg)](https://github.com/adriacabeza/GAN-Workshop)[![made-with-python](https://img.shields.io/badge/Made%20with-Python-1f425f.svg)](https://www.python.org/)[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/adriacabeza/GAN-Workshop/)

## Charla: Introducción a las Redes Generativas Adversarias

El contenido más teórico de la charla está disponible en las [slides](slides/slides.pdf).

## Proyecto: Autocolorizador

Además para ver un uso de las GANs y su implementación, se ha hecho este pequeño proyecto que pretende colorizar imágenes en blanco y negro usando una conditional GAN. 

### Prerequisites

- Para instalar los requerimientos, usa el requirements.txt (vas a necesitarlos para preparar el dataset).

```bash

pip install -r requirements.txt

```

### Resultados

Aquí podemos ver algunos resultados obtenidos (hand-picked) tras un día de training en un dataset de 36.500 imágenes: 

| Results |

|--------|

|   ![](docs/output11.png)   |

|   ![](docs/output1.png)    |

|   ![](docs/output2.png)    |

|   ![](docs/output3.png)    |

|   ![](docs/output5.png)    |

|   ![](docs/output6.png)    |

|   ![](docs/output4.png)    |

|   ![](docs/output7.png)    |

|   ![](docs/output8.png)    |

|   ![](docs/output9.png)    |

|   ![](docs/output.png)   |

Además puedes descargarte los weights del generador por si queréis hacer pruebas: **[generador](./weights/generator.h5)**.

### Arquitectura

Este código está basado en la arquitectura [**pix2pix**](https://arxiv.org/abs/1611.07004). Pese a disponer de un generador y un discriminador con objetivos opuestos en busca de un equilibrio de Nash, esta arquitectura es diferente a las GANs normales pues está no coge como input ruido aleatorio (espacio latente),  en esta en cambio cogemos como input toda una imagen *x*. Nuestro objetivo es **traducirla** en otra imagen con una estructura similar. Es decir, nuestro generador *G* tiene que producir *G(X)* el cual tendrá que ser indistinguible de *y* (la otra imagen con una estructura similar) para nuestro discriminador *D*.

Sus partes principales son:

- **Generador U-NET**: el generador de la pix2pix se parece mucho a un **autoencoder**. Coge la imagen que tiene que ser traducida, la comprime a un espacio de menos dimensiones llamado **Cuello de Botella** y luego aprende a hacer upsampling para conseguir la imagen deseada como output. 

  Además también tiene ciertos parecidos con una ResNet en la manera en como la información de capas previas es introducida a las siguientes usando las llamadas **skip connections**. En esta arquitectura disponemos de skip connections que salen de la mitad encoder de la red y van a la otra mitad decoder. Esto nos sirve para prevenir que perdamos información en el cuello de botella.



  



- **Discriminador Patch-GAN**: en este discriminador en vez de coger las imágenes y clasificarlas en verdaderas o falsas, se clasifican individualmente diferentes trozos de la imagen así se refuerza el objetivo de conseguir detalles mucho más nítidos. Además es más rápido de clasificar toda una imagen ya que solo tiene que clasificar pequeños trozos y eso significa menos parámetros.



  



### Dataset

Como dataset se ha usado un subset de [Places365](http://places2.csail.mit.edu/download.html) de 1GB aproximadamente (podría haber usado uno más grande pero la combinació: internet de pueblo + confinamiento, no es muy buena :sad_noises: ).

Para preparar el dataset para el notebook, necesitamos que cada par de imágenes (blanco y negro y colorida) esten combinadas en la misma imágen (mitad y mitad). Para hacerlo primero hay que descargarse las imágenes a color y luego usar los siguientes scripts disponibles en la carpeta dataset:

```

python3 create_grayscale.py --original ../data/original --grayscale ../data/gray_scale

python3 combine_images.py --original ../data/original --grayscale ../data/gray_scale

```

Esto os creará una carpeta con el dataset preparado.

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/adriacabeza/gan-workshop

Awesome Lists containing this project

README

Introducción a las Redes Generativas Adversarias :robot: + Autocolorizador 🌈