An open API service indexing awesome lists of open source software.

https://github.com/canokaue/eel7513

Projeto final da disciplina EEL7513/EEL7514/EEL510417 - Introdução ao Aprendizado de Máquina.
https://github.com/canokaue/eel7513

clothing-recognition convolutional-neural-networks cuda-support deep-learning deepfashion eel7513 fashion-classifier jupyter-notebooks keras machine-learning machine-learning-algorithms mobilenetv2 multi-label-classification python3 pytorch resnet-50 tensorflow ufsc vgg16 vgg16-model

Last synced: 6 months ago
JSON representation

Projeto final da disciplina EEL7513/EEL7514/EEL510417 - Introdução ao Aprendizado de Máquina.

Awesome Lists containing this project

README

          

# CNNs para a Classificação Multirrótulo de Peças de Roupa [![EEL7513](https://cdn.rawgit.com/sindresorhus/awesome/d7305f38d29fed78fa85652e3a63e154dd8e8829/media/badge.svg)](https://geltro.ufsc.br/files/2016/07/EEL7514-T%C3%B3pico-Avan%C3%A7ado-em-Processamento-de-Sinais.pdf) [![made-with-python](https://img.shields.io/badge/Made%20with-Python-1f425f.svg)](https://www.python.org/) [![PyPI status](https://img.shields.io/pypi/status/ansicolortags.svg)](https://defend.wikileaks.org/donate/) [![PyPI format](https://img.shields.io/pypi/format/ansicolortags.svg)](https://drive.google.com/drive/folders/1U__8deYCj6fFf4255wSSm4RKl7oYQslK)

> Projeto desenvolvido colaborativamente com [Ruan Comelli](https://github.com/ruancomelli)

Mantendo em foco tanto a proposta de um classificador multi-label a nível próximo
ao estado-da-arte e ao mercado quanto o estudo estrutural do problema de classificação de
imagens com números elevados de possibilidade de atributos, o presente trabalho definiu
como objetivos principais:

1. P-Net: Construir uma rede neural convolucional utilizando uma parte do conjunto DeepFashion, empregando
mecanismos de atenção envolvendo landmarks (pontos limítrofes da peça de roupa)
para a categorização de classe (tipos de roupa como camiseta, calça e blusa) e atributos
(como azul, estampado e verão).

2. K-Net: Expandir o mesmo trabalho, aplicado exclusivamente para a categorização de múltiplos atributos (excluindo a classificação e a detecção de landmarks), analisando diversos parâmetros de treino, bem como diferentes redes-base pré-treinadas no lugar da
VGG16, como a ResNet50V2 e a MobileNetV2.

Para otimizações e processamento de dados, bibliotecas como Scikit-learn (0.21.3),
Pandas (0.25.3) e Numpy (1.17.4) foram empregadas em ambos os códigos, todas elas em
suas versões mais recentes (02/12/2019) enquanto as redes foram construídas com as duas
bibliotecas líderes do mercado de redes neurais para deep learning.

A rede K-Net foi completamente desenvolvida utilizando a interface integrada
de desenvolvimento Google Colab utilizando funções e redes-base do Tensorflow 1.15.0 e
Keras 2.2.5.

Já a rede P-Net foi desenvolvida pela interface do Visual Studio Code 1.40.1 com a
biblioteca Pytorch 1.3.1 para Cuda 10.1, contando com uma estrutura clássica de projetos
em Python - modularização de funções e variáveis em diversos arquivos com execução por
terminal de comandos Unix.

Resultados:




O relatório final entregue pode ser acessado pela pasta /docs, juntamente à proposta inicial.