https://github.com/ramirjunior/idox-ia-project
Projeto MVP com processamento de áudio com IA local
https://github.com/ramirjunior/idox-ia-project
inteligencia-artificial java-17 llama process-builder spring-boot thymeleaf whisper
Last synced: about 1 month ago
JSON representation
Projeto MVP com processamento de áudio com IA local
- Host: GitHub
- URL: https://github.com/ramirjunior/idox-ia-project
- Owner: RamirJunior
- License: mit
- Created: 2025-08-06T21:16:40.000Z (10 months ago)
- Default Branch: main
- Last Pushed: 2025-08-07T04:57:03.000Z (10 months ago)
- Last Synced: 2025-08-07T06:30:42.189Z (10 months ago)
- Topics: inteligencia-artificial, java-17, llama, process-builder, spring-boot, thymeleaf, whisper
- Language: Java
- Homepage:
- Size: 66.4 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# iDox ©
iDox é um sistema interno de transcrição e resumo de arquivos de áudio utilizando inteligência artificial local. Desenvolvido como um MVP para uso na Procuradoria Geral do Estado do Maranhão, o objetivo é acelerar a análise de conteúdo falado com foco em privacidade e agilidade.
## Descrição
O sistema permite que arquivos de áudio sejam transcritos automaticamente por meio do modelo Whisper da OpenAI, e posteriormente resumidos com o modelo LLaMA. Ambos os modelos rodam localmente em versões compiladas em C++ e são executados via chamadas com `ProcessBuilder`.
A aplicação foi desenvolvida com Java 17 e utiliza o ecossistema Spring Boot, com interface web baseada em Thymeleaf. Não há persistência de dados: os arquivos são processados temporariamente e removidos automaticamente por tarefas agendadas.
## Tecnologias Utilizadas
- Java 17
- Spring Boot
- Maven
- Thymeleaf
- Lombok
- Whisper (OpenAI) - transcrição de áudio
- LLaMA (Meta) - geração de resumo
- Execução de modelos via ProcessBuilder (C++ binários locais)
- Tarefas agendadas (`@Scheduled`) para limpeza de arquivos
- Execução assíncrona com `@Async` e controle de fila
## Características Técnicas
- Arquitetura baseada no padrão MVC.
- IA’s rodam localmente para garantir confidencialidade dos dados.
- Métodos de execução de IA são assíncronos (`@Async`) e controlados por fila para evitar sobrecarga.
- Sistema sem banco de dados: os arquivos são armazenados temporariamente no sistema de arquivos e excluídos periodicamente.
- Utilização de Scheduled Tasks para exclusão automática de arquivos após um período definido.
- Aplicação projetada para execução em ambiente Linux, com os binários de IA previamente compilados com os recursos dentro das disposições técnicas na PGE-MA.
## Requisitos
- Java 17
- Maven 3.x
- Whisper Open AI versão compilada em C++
- LLaMA versão compilada em C++
### Observação
- _Os módulos de IA - Whisper e Llama - foram removidos do repositório para fins de praticidade na documentação._
- _A documentação dos binários utilizados pode ser consultada nos links: [Open AI - Whisper](https://github.com/ggml-org/whisper.cpp) e [Llama](https://github.com/ggml-org/llama.cpp)_