Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/chaos4455/graphnlp
https://github.com/chaos4455/graphnlp
Last synced: 7 days ago
JSON representation
- Host: GitHub
- URL: https://github.com/chaos4455/graphnlp
- Owner: chaos4455
- Created: 2024-11-10T13:15:29.000Z (7 days ago)
- Default Branch: main
- Last Pushed: 2024-11-10T13:33:27.000Z (7 days ago)
- Last Synced: 2024-11-10T14:25:20.286Z (7 days ago)
- Language: HTML
- Size: 7.1 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 🚀 Projeto de Visualização 3D de Clusters de Palavras
[![Status do Projeto](https://img.shields.io/badge/Status-Em_Desenvolvimento-orange?style=flat-square)](#)
[![Python](https://img.shields.io/badge/Python-3.10-blue?style=flat-square&logo=python&logoColor=white)](#)
[![NLP](https://img.shields.io/badge/NLP-Processamento_de_Linguagem_Natural-brightgreen?style=flat-square)](#)
[![BERT](https://img.shields.io/badge/Modelo-BERT-000?style=flat-square&logo=transformers)](#)
[![OpenGL](https://img.shields.io/badge/OpenGL-Visualização_3D-9cf?style=flat-square&logo=opengl)](#)
[![Plotly](https://img.shields.io/badge/Plotly-Visualização%20Interativa-informational?style=flat-square&logo=plotly&logoColor=white)](#)
[![FAISS](https://img.shields.io/badge/FAISS-Facebook%20AI%20Similarity%20Search-critical?style=flat-square&logo=facebook)](#)
[![Licença](https://img.shields.io/badge/Licença-MIT-green?style=flat-square)](#)
[![PRs Bem-vindas](https://img.shields.io/badge/PRs-Bem%20vindas-brightgreen?style=flat-square&logo=github)](#)# 💡 Sobre Mim - Elias Andrade
## 👨💻 Quem Sou Eu?
Sou **Elias Andrade**, um entusiasta e desenvolvedor especializado em **Machine Learning**, **Processamento de Linguagem Natural (NLP)** e **MLops/LLMops**. Minha experiência abrange tanto a **integração de modelos** como a **otimização e manutenção** de sistemas de aprendizado de máquina em ambientes de produção.
Ao longo da minha trajetória, dediquei-me a explorar as fronteiras de tecnologias emergentes, integrando técnicas avançadas como **transformers** e **modelos de linguagem** com **infraestruturas escaláveis** e **automação de pipelines de ML**. Com isso, estou preparado para resolver problemas complexos, oferecendo soluções robustas e eficientes, que evoluem conforme a demanda.
## 🧠 Meu Conhecimento
Minhas habilidades envolvem uma combinação de ferramentas e frameworks que me permitem não apenas criar modelos, mas também gerenciar toda a infraestrutura e operacionalização de soluções de **IA** e **ML** em larga escala.
- **Machine Learning (ML)**: De **algoritmos clássicos** a **Deep Learning**, utilizando **PyTorch**, **TensorFlow**, **scikit-learn**, **XGBoost**, **LightGBM**.
- 🔧 **Modelagem de Dados**: Análise de dados, extração de características e transformação de dados para treinamento de modelos.
- 🧠 **Treinamento de Modelos**: Customização de redes neurais, tuning de hiperparâmetros, e técnicas de **transfer learning**.
- ⚙️ **Pipelines de ML**: Construção de pipelines automatizados com **MLflow**, **Kubeflow**, **Airflow** para automação do ciclo de vida de modelos.- **NLP (Processamento de Linguagem Natural)**:
- 🔍 **Pré-processamento**: Tokenização, lematização, e análise sintática de texto.
- 🗣️ **Modelos de Linguagem**: Experiência com **BERT**, **GPT**, **T5**, **DistilBERT** e outros modelos de NLP, tanto para tarefas supervisionadas quanto para **embedding de palavras** e **classificação de texto**.
- 🤖 **Chatbots Inteligentes**: Desenvolvimento de sistemas interativos baseados em NLP para automação de processos.- **MLOps / LLMOps**:
- 🌐 **Deploy e Orquestração**: Utilização de **Docker**, **Kubernetes**, **CI/CD** com **GitLab**, **Jenkins**, **ArgoCD** para garantir que modelos de ML sejam implementados e escaláveis em ambientes de produção.
- 🔄 **Monitoramento e Manutenção de Modelos**: Implementação de sistemas de monitoramento para detectar desvios no desempenho e realizar re-treinamento com **Pipelines de ML**.
- 🔒 **Segurança e Ética**: Aplicação de práticas de segurança e privacidade de dados em modelos de IA, garantindo que eles sejam robustos e responsáveis.- **LLMOps (Operações de Modelos de Linguagem de Grande Escala)**:
- 🚀 **Escalabilidade**: Integração de modelos de linguagem em ambientes de produção em larga escala, com soluções **multi-cloud**.
- ⚖️ **Balanceamento de Carga**: Uso de **FAISS** e outras técnicas para acelerar buscas semânticas em grandes volumes de dados e otimizar as respostas dos modelos.## 🔧 Ferramentas e Tecnologias
Estou familiarizado com as principais tecnologias e ferramentas que ajudam a impulsionar o desenvolvimento e a implementação de soluções baseadas em IA e ML:
- 🧑💻 **Linguagens de Programação**: Python (para ML e NLP), Bash, SQL
- 📊 **Frameworks e Bibliotecas**:
- **PyTorch**, **TensorFlow**, **scikit-learn**, **Hugging Face Transformers**, **spaCy**
- **Kubeflow**, **MLflow**, **TensorFlow Extended (TFX)**
- **Streamlit**, **Plotly** para visualizações interativas
- **FAISS** e **HNSW** para buscas rápidas em grandes volumes de dados
- 🛠️ **MLOps Tools**:
- **Docker**, **Kubernetes** (com **KEDA**, **ArgoCD**), **GitOps**
- **CI/CD**: GitLab, Jenkins
- 🖥️ **Desenvolvimento de APIs**: **FastAPI**, **Flask**, **Node.js**, **GraphQL**## 🚀 O Que Isso Significa para Mim?
- 🔍 **Experiência em Transformar Dados em Insights**: Eu não apenas crio modelos, mas entendo como transformar grandes volumes de dados em **informações acionáveis**.
- 🔄 **Ciclo Completo de Desenvolvimento**: Desde a pesquisa e desenvolvimento até a integração e manutenção, meu trabalho abrange todas as fases do ciclo de vida dos modelos de IA e ML.
- 💻 **Automação e Escalabilidade**: Entendo a importância de criar sistemas **automáticos e escaláveis**, seja no **treinamento de modelos** ou na **orquestração de pipelines**.
- 🌱 **Pesquisa Contínua e Inovação**: Estou sempre aprendendo e aplicando novas técnicas, buscando as últimas inovações na área de **modelos de linguagem** e **aprendizado de máquina**.## 🎯 O Que Me Diferencia?
O meu diferencial está em como **integro e automatizo** soluções, não apenas criando modelos poderosos, mas também garantindo que eles funcionem de maneira **eficiente e sustentável** no mundo real. Ao combinar minha experiência em **MLOps** e **LLMops**, sou capaz de construir **sistemas autônomos** que **aprendem e evoluem**, ao mesmo tempo que **garantem alta performance e escalabilidade**.
## 🚀 Como posso ajudar?
Se você está buscando alguém para transformar dados em **insights prontos para uso**, otimizar seu processo de **desenvolvimento de IA**, ou escalar seu modelo de **ML/NLP** para ambientes de produção, eu sou a pessoa certa para isso. Combinando **pesquisa de ponta** com **soluções práticas**, posso ajudar a levar seu projeto ao próximo nível.
---
## 🛠️ Tecnologias em Destaque
![Python](https://img.shields.io/badge/Python-3.10-blue?style=flat-square&logo=python&logoColor=white)
![PyTorch](https://img.shields.io/badge/PyTorch-1.10-orange?style=flat-square&logo=pytorch&logoColor=white)
![TensorFlow](https://img.shields.io/badge/TensorFlow-2.0-ff6f00?style=flat-square&logo=tensorflow&logoColor=white)
![Kubernetes](https://img.shields.io/badge/Kubernetes-1.24-blue?style=flat-square&logo=kubernetes&logoColor=white)
![MLOps](https://img.shields.io/badge/MLOps-Continuous%20Integration%20%26%20Deployment-yellowgreen?style=flat-square)
![NLP](https://img.shields.io/badge/NLP-Transformers%20%26%20BERT-brightgreen?style=flat-square&logo=transformers)---
# 📈 Meus Projetos
Dê uma olhada nos meus projetos para ver como estou aplicando esses conhecimentos no mundo real:
1. [Kubernetes MicroService Architecture Portfolio](https://github.com/chaos4455/Kubernetes-MicroService-Archtect-Portfolio)
---
⚡ **Vamos transformar dados em soluções reais?** Entre em contato para colaborar em projetos de **IA** e **ML**.
---
## 🎯 Objetivo do Projeto
Este projeto visa **desenvolver uma visualização 3D avançada para análise de clusters de palavras**, explorando o uso de **modelos de linguagem** e **algoritmos de machine learning**. A ideia é criar um ambiente onde grandes quantidades de dados textuais são visualizados de forma interativa, facilitando o entendimento de relações semânticas e padrões complexos em dados textuais, por meio das seguintes tecnologias e scripts:
---
## 📜 Scripts Principais e Tecnologias Utilizadas
### 1. **`cluster_palavras_tech_faiss_v3.py`**
- **Descrição**: Este script realiza o agrupamento hierárquico de palavras com foco em terminologia técnica usando **FAISS** e **K-means**, permitindo uma visualização em 3D dos agrupamentos resultantes através do **Plotly**.
- ![FAISS](https://img.shields.io/badge/FAISS-Facebook%20AI%20Similarity%20Search-blue?style=flat-square) ![K-means](https://img.shields.io/badge/Algoritmo-K--means-yellowgreen?style=flat-square) ![Plotly](https://img.shields.io/badge/Plotly-Visualização%20Estática%203D-ff69b4?style=flat-square)
- **Tecnologias**:
- **FAISS**: Utilizado para pesquisa de similaridade altamente eficiente, permitindo que grandes volumes de dados sejam processados de forma rápida.
- **K-means**: Algoritmo de clustering que organiza as palavras em grupos com base em similaridade semântica.
- **Plotly**: Gera gráficos 3D interativos para que o usuário explore os clusters e suas conexões de maneira intuitiva.
- **Conhecimento Demonstrado**: Avançado em algoritmos de agrupamento e visualização de dados com grandes volumes de informação.[📄 Documentação Completa](docs/scripts/cluster_palavras_tech_faiss_v3.md)
---
### 2. **`cluster_3d_hierarquico.py`**
- **Descrição**: Este script explora o clustering hierárquico em um ambiente 3D, onde os dados podem ser visualizados de maneira interativa com o auxílio do **OpenGL** e **Pygame**, proporcionando uma análise dinâmica das relações entre clusters.
- ![OpenGL](https://img.shields.io/badge/OpenGL-Visualização%20Gráfica-8A2BE2?style=flat-square&logo=opengl) ![Pygame](https://img.shields.io/badge/Pygame-Engine%20Interativa-green?style=flat-square&logo=pygame)
- **Tecnologias**:
- **OpenGL**: Usado para renderizar gráficos 3D, permitindo a visualização complexa e detalhada das hierarquias entre palavras.
- **Pygame**: Responsável pela interatividade em tempo real, permitindo ao usuário explorar a visualização de maneira intuitiva.
- **Conhecimento Demonstrado**: Proficiência em gráficos 3D e manipulação de clusters hierárquicos, habilidades em interatividade em tempo real com ferramentas de visualização gráfica.[📄 Documentação Completa](docs/scripts/cluster_3d_hierarquico.md)
---
### 3. **`bert_orbital_words_3d.py`**
- **Descrição**: Focado em criar embeddings com o **BERT**, este script explora as relações entre palavras através de uma simulação em órbita, onde palavras circulam em torno de seus clusters para uma visualização mais intuitiva.
- ![BERT](https://img.shields.io/badge/BERT-Embeddings%20de%20Palavras-000000?style=flat-square&logo=transformers) ![Pymunk](https://img.shields.io/badge/Pymunk-Física%203D-cyan?style=flat-square)
- **Tecnologias**:
- **BERT**: Modelo de linguagem que gera embeddings contextuais, permitindo uma visualização semântica sofisticada de palavras.
- **Pymunk**: Biblioteca de física 2D/3D que adiciona uma dimensão realística de órbita aos dados, simulando interações e distância entre clusters.
- **Conhecimento Demonstrado**: Integração de modelos de linguagem natural com física simulada para visualizações interativas e análise semântica profunda.[📄 Documentação Completa](docs/scripts/bert_orbital_words_3d.md)
---
## 🛠️ Dependências e Configurações
Para reproduzir o projeto, é recomendável instalar as dependências listadas em `requirements.txt`, que incluem bibliotecas para machine learning, visualização e processamento de dados em 3D.
---
## 📂 Estrutura Completa de Arquivos
```plaintext
📁 Projeto de Visualização 3D de Clusters
├── cluster_palavras_tech_faiss_v3.py
├── cluster_3d_hierarquico.py
├── bert_orbital_words_3d.py
├── requirements.txt
├── 📁 docs
│ ├── README.md
│ └── 📁 scripts
│ ├── cluster_palavras_tech_faiss_v3.md
│ ├── cluster_3d_hierarquico.md
│ └── bert_orbital_words_3d.md
└── ...
```![Cursor_z2uXbkF6dt](https://github.com/user-attachments/assets/d1c6b493-616f-44ad-b3c4-3f95ea13dcca)
![Cursor_lRVhlF8kea](https://github.com/user-attachments/assets/920c6cff-74fb-48cc-a948-24a2e319ccfb)
![Cursor_RwvX1xIV47](https://github.com/user-attachments/assets/149058bb-27d5-4c5f-bad8-99363d67e5d6)
![Cursor_w8609rdNJt](https://github.com/user-attachments/assets/c0add63e-9403-4bbb-a2ac-43c6bd7d1405)
![Cursor_rkMCepmkWp](https://github.com/user-attachments/assets/3e2129b3-44a8-4607-8054-6acdce17e4f7)
![Cursor_WSgSopoezV](https://github.com/user-attachments/assets/84ab692d-96fb-42a3-937e-665e2cfb979f)
![Cursor_4vEh68mAt4](https://github.com/user-attachments/assets/a0193500-9785-4fa3-b39f-47f612304480)
![Cursor_tGnvhhQSoI](https://github.com/user-attachments/assets/be29e0ec-747a-4ece-a297-ca8a970c78bc)
![heatmap_clusters_20241109_204428_e8d56ca0](https://github.com/user-attachments/assets/d8a7e296-518b-487a-8322-df3725037367)
![Cursor_iBbUEwhrIE](https://github.com/user-attachments/assets/7ae1075c-9b08-4027-86c3-e7c46ac43532)
![Cursor_4vBTwnlS85](https://github.com/user-attachments/assets/34e447d2-ea7a-455a-978e-4ab5d72b457c)
![Cursor_NnsrrgUzv0](https://github.com/user-attachments/assets/e92e7b7c-710d-48d0-8a12-e662d4e6ded1)
![Cursor_k1EnoJrz8z](https://github.com/user-attachments/assets/d7e0760b-cda9-4bfc-bf3d-b7515b8f0691)
![python_h4upCXwov8](https://github.com/user-attachments/assets/d5d8f73a-e5c7-4800-b822-087599a99148)
![python_S6Hg4oTKP0](https://github.com/user-attachments/assets/e8115750-b493-4aaa-b2c7-9add98b2fb29)
![python_YrK2vGAi9x](https://github.com/user-attachments/assets/16a5fd03-9524-40a9-9327-97ce8ba3ca2b)
![mesh3d_isometric_f31ae098](https://github.com/user-attachments/assets/62d5493a-aaa8-4d08-9c33-0f76a6d822d0)
![mesh3d_top_f31ae098](https://github.com/user-attachments/assets/a3893cce-5804-4cd4-a2bc-bfa44d41d2ce)
![mesh3d_side_f31ae098](https://github.com/user-attachments/assets/4b43db53-9495-48dc-aca4-4d0239da9fec)
![mesh3d_perspective_f31ae098](https://github.com/user-attachments/assets/e89fd718-2101-43ef-96a4-e22a9a5820d0)
![mesh3d_angular_f31ae098](https://github.com/user-attachments/assets/f84b1b7c-cacf-4a12-a8eb-819bbcfec5eb)
![tech_clusters_3d_20241109_213200_25da37e9](https://github.com/user-attachments/assets/2a9b66c1-b6d3-499e-aebc-de6387f3624c)
![Cursor_TgQbvLh4Vg](https://github.com/user-attachments/assets/3e479b03-a407-48fc-978f-dff310b62983)
![likelihood_distribution_20241109_213850_b130d1dc](https://github.com/user-attachments/assets/429c5f1e-4844-4cff-b507-f8afcd97003c)
![dendrograma_20241109_213851_ddc2af3b](https://github.com/user-attachments/assets/7dea9add-8cfd-45fd-9e9e-25a7392cf032)
![Cursor_k8638ioNmw](https://github.com/user-attachments/assets/1204f122-1cfa-444e-8238-7a6787a23956)