Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/cgarciae/supervised-intermedio-mnist
https://github.com/cgarciae/supervised-intermedio-mnist
Last synced: 25 days ago
JSON representation
- Host: GitHub
- URL: https://github.com/cgarciae/supervised-intermedio-mnist
- Owner: cgarciae
- License: mit
- Created: 2017-04-30T16:18:42.000Z (over 7 years ago)
- Default Branch: master
- Last Pushed: 2017-05-04T22:01:08.000Z (over 7 years ago)
- Last Synced: 2024-11-07T09:38:35.617Z (3 months ago)
- Language: Jupyter Notebook
- Size: 116 KB
- Stars: 0
- Watchers: 3
- Forks: 4
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Reto MNIST
## Descripcion
El [MNIST](http://yann.lecun.com/exdb/mnist/) es un conjunto de imágenes de digitos del 0 al 9 escritos a mano.![alt text][s1]
Este dataset tiene mas de 60,000 imágenes separadas en 10 clases. El reto es construir un clasificador de imágenes que sea capaz de reconocer los digitos.
### Formato Datos
Todos los datos viven en la carpeta `.dataget/data` y se dividen en 2 grupos
```
|- .datageterman Traffic Signs
|- data
|- mnist
|- traning-set
|- test-set
```
**Estructura**
Cada sub conjunto de datos (training-set o test-set) tiene la siguiente estructura
```
|- {subset}
|- {class_id}
|- {image_id}.jpg
```
Donde
* `subset`: es `training-set` o `test-set`
* `class_id`: es el identificador de una clase, e.g. 0, 1, 2... 9
* `image_id`: es el nombre de una imagen.### Variables
Cada imagen como tal puede ser representada por una matriz de dimensiones `height x width` dado que estan en escala de grises.### Objetivo
1. Crear un algoritmo que tome una imagen de entrada, ya sea como vector o matriz, y retorne el clase (`class_id`) a la que pertenece esa imagen.
1. Entrenar este algoritmo utilizando los datos de la carpeta `data/training-set`.
1. Medir el performance/score del algoritmo utilizando los datos de la carpeta `data/test-set`. El performance debe ser medido como
```python
score = n_aciertos / n_imagenes * 100
```
donde `n_aciertos` es el numero de imagenes clasificadas de forma correcta y `n_imagenes` es el numero total de imagenes en el `test-set`.### Notas Teoricas
* Dado que las imagenes son conjuntos con dimensiones muy altas, usualmente la mejor manera de atacar el problema es utilizando [redes neuronales](https://en.wikipedia.org/wiki/Artificial_neural_network).
* Para imagenes es recomendable utilizar redes [convolucionales](http://cs231n.github.io/convolutional-networks/).### Solución
Ver procedimiento de [solucion](https://github.com/colomb-ia/formato-retos#solucion).##### Requerimientos
*Indica los requerimientos para utilizar el codigo de tu solucion.*##### Procedimiento
*Indica el procedimiento que se debe seguir para reproducir tu solucion.*##### Método
*Indica el metodo que utilizaste para solucionar el reto.*##### Resultados
*Indica el metodo que utilizaste para solucionar el reto.*## Getting Started
Para resolver este reto primero has un [fork](https://help.github.com/articles/fork-a-repo/) de este repositorio y [clona](https://help.github.com/articles/cloning-a-repository/) el fork en tu maquina.```bash
git clone https://github.com/{username}/supervised-avanzado-mnist
cd supervised-avanzado-mnist
```*Nota: reemplaza `{username}` con tu nombre de usuario de Github.*
### Requerimientos
Para descargar y visualizar los datos necesitas Python 2 o 3. Las dependencias las puedes encontrar en el archivo `requirements.txt`, el cual incluye
* pillow
* numpy
* pandas
* jupyterPuedes instalarlas fácilmente utilizando el commando
```bash
pip install -r requirements.txt
```
Dependiendo de tu entorno puede que necesites instalar paquetes del sistema adicionales, si tienes problemas revisa la documentación de estas librerías.### Descarga y Preprocesamiento
Para descargar los datos ejecuta el comando
```bash
dataget get mnist
```
Esto descarga los archivos en la carpeta `.dataget/data`, los divide en los conjuntos `training-set` y `test-set`, convierte las imagenes en `jpg` de dimensiones `32x32`. Las originalmente vienen en formato `.ppm` y con dimensiones variables. Si deseas mantener el formato original ejecuta en vez```bash
dataget get --dont-process mnist
```# Starter Code Python
Para iniciar con este reto puedes correr el codigo de Python en Jupyter del archivo `python-sample.ipynb`. Este código que ayudará a cargar y visualizar algunas imágenes. Las dependencias son las mismas que se instalaron durante la descarga de los datos, ver [Requerimientos](#requerimientos).Para iniciar el código solo hay que prender Jupyter en esta carpeta
```bash
jupyter notebook .
```
y abrir el archivo `python-sample.ipynb`.# Soluciones
| Score | Usuario | Algoritmo | Link Repo |
| - | - | - | - |
| *score* | *nombre* | *algoritmo* | *link* |[s1]: http://rodrigob.github.io/are_we_there_yet/build/images/mnist.png?1363085077 "S"