Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/izadoraluz/implementacao-do-modelo-bag-of-words-em-python

Este projeto implementa o modelo Bag of Words para NLP em Python, com base em um tutorial do Kaggle, e testa sua aplicação em frases em inglês e português.
https://github.com/izadoraluz/implementacao-do-modelo-bag-of-words-em-python

Last synced: 5 days ago
JSON representation

Este projeto implementa o modelo Bag of Words para NLP em Python, com base em um tutorial do Kaggle, e testa sua aplicação em frases em inglês e português.

Awesome Lists containing this project

README

        

# Implementação do Modelo Bag of Words em Python

## 👤 **Integrante:**

- [Izadora Luz](https://www.linkedin.com/in/izadoraluz-rsn/)

## 👨‍🏫 **Professores:**

- [Renato Penha](https://www.linkedin.com/in/renato-penha/) - Professor orientador
- [Victor Hayashi](https://www.linkedin.com/in/vthayashi/) - Professor de programação

## **📝 Descrição**

Este projeto é uma implementação do modelo Bag of Words para processamento de linguagem natural (NLP), seguindo o tutorial disponível no Kaggle ([Bag of Words Model for Beginners](https://www.kaggle.com/code/vipulgandhi/bag-of-words-model-for-beginners)). O objetivo é desenvolver um código Python no Google Colab com base no tutorial e aplicar o modelo em diferentes conjuntos de frases para observar seus efeitos e resultados.

### Objetivos do Projeto:

1. **Implementação Baseada no Tutorial:** Seguir a implementação guiada do modelo Bag of Words, conforme descrito no tutorial do Kaggle, adaptando o código para ser executado no Google Colab.

2. **Organização das Etapas:** Estruturar o código em seções bem definidas, cada uma com uma descrição clara da sua funcionalidade e propósito no processamento do texto.

3. **Testes com Diferentes Frases:** Realizar testes com 50 frases, divididas em 25 frases em inglês e 25 frases em português, para analisar a eficácia do modelo em diferentes idiomas. Para este passo, é permitido o uso de bibliotecas adicionais que auxiliem no processamento de textos em português.

## **📁 Estrutura de Pastas**

- `README.md`: Documentação do projeto.
- `bag_of_words.ipynb`: Notebook Jupyter com a implementação do modelo Bag of Words e os testes realizados com frases em inglês e português.

## 📚 **Referências**

GANDHI, Vipul. *Bag of Words Model for Beginners*. Kaggle, 2023. Disponível em: . Acesso em: 06 maio 2024.