Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/viniciusds2020/ml_pycaret_classificacao

Sistema de preprocessamento e treinamento de modelos de machine learning utilizando PyCaret. Uma metodologia low-code para processos de MLops
https://github.com/viniciusds2020/ml_pycaret_classificacao

machine-learning mlops preprocessing pycaret python scikit-learn

Last synced: about 1 month ago
JSON representation

Sistema de preprocessamento e treinamento de modelos de machine learning utilizando PyCaret. Uma metodologia low-code para processos de MLops

Awesome Lists containing this project

README

        

# Sistema de Preprocessamento e Treinamento de Modelos de Machine Learning com PyCaret

Bem-vindo ao repositório do **Sistema de Preprocessamento e Treinamento de Modelos de Machine Learning** utilizando PyCaret. Este projeto oferece uma metodologia **low-code** para processos de **MLOps** (Machine Learning Operations), facilitando a criação e a implementação de modelos de machine learning.

## Sumário

- [Descrição](#descrição)
- [Funcionalidades](#funcionalidades)
- [Tecnologias Utilizadas](#tecnologias-utilizadas)
- [Instalação](#instalação)
- [Como Usar](#como-usar)
- [Contribuição](#contribuição)
- [Licença](#licença)

## Descrição

Este projeto visa simplificar as etapas de preprocessamento de dados, treinamento, validação e implantação de modelos de machine learning, utilizando a biblioteca PyCaret. O foco é proporcionar uma interface intuitiva e amigável, reduzindo a necessidade de codificação extensa, e promovendo práticas de MLOps que garantem a escalabilidade e a manutenção dos modelos.

## Funcionalidades

- **Preprocessamento de Dados**: Limpeza, transformação e preparação dos dados para o treinamento.
- **Treinamento de Modelos**: Criação e avaliação de múltiplos modelos de machine learning com apenas algumas linhas de código.
- **Validação de Modelos**: Avaliação de desempenho dos modelos utilizando técnicas de validação cruzada.
- **Comparação de Modelos**: Ferramentas para comparar diferentes modelos e escolher o mais adequado.
- **Implantação de Modelos**: Facilidades para exportação e implementação dos modelos treinados em ambientes de produção.

## Tecnologias Utilizadas

- [PyCaret](https://pycaret.org/)
- [Pandas](https://pandas.pydata.org/)
- [NumPy](https://numpy.org/)
- [Scikit-Learn](https://scikit-learn.org/)
- [Jupyter Notebook](https://jupyter.org/)

## Instalação

Para começar a utilizar o projeto, siga os passos abaixo:

1. **Clone o repositório:**

```bash
git clone https://github.com/seu-usuario/nome-do-repositorio.git
cd nome-do-repositorio
```

2. **Crie e ative um ambiente virtual:**

```bash
python -m venv venv
source venv/bin/activate # Para Linux/MacOS
venv\Scripts\activate # Para Windows
```

3. **Instale as dependências:**

```bash
pip install -r requirements.txt
```

## Como Usar

1. **Pré-processamento de Dados:**
Carregue seus dados e utilize as funções de preprocessamento para limpeza e preparação.

```python
from pycaret.datasets import get_data
from pycaret.classification import setup, compare_models

# Carregar dados de exemplo
data = get_data('titanic')

# Configurar o ambiente de preprocessamento
s = setup(data, target='survived')
```

2. **Treinamento e Comparação de Modelos:**
Treine e compare múltiplos modelos de machine learning facilmente.

```python
best_model = compare_models()
```

3. **Avaliação e Implantação:**
Avalie o melhor modelo e implemente-o em produção.

```python
from pycaret.classification import save_model, load_model

# Salvar o modelo treinado
save_model(best_model, 'melhor_modelo')

# Carregar o modelo salvo
modelo_carregado = load_model('melhor_modelo')
```

## Contribuição

Contribuições são bem-vindas! Sinta-se à vontade para abrir issues e pull requests. Para maiores informações, veja o arquivo [CONTRIBUTING.md](CONTRIBUTING.md).

## Licença

Este projeto está licenciado sob a Licença MIT. Veja o arquivo [LICENSE](LICENSE) para mais detalhes.

---

Esperamos que você aproveite este projeto e que ele facilite seu trabalho com machine learning! Se tiver alguma dúvida ou sugestão, não hesite em entrar em contato.