https://github.com/maxsonferovante/recognition_lambda_fuction
Função AWS Lambda que processa PDFs através de eventos SQS, extraindo texto e salvando em JSON no S3.
https://github.com/maxsonferovante/recognition_lambda_fuction
Last synced: 2 months ago
JSON representation
Função AWS Lambda que processa PDFs através de eventos SQS, extraindo texto e salvando em JSON no S3.
- Host: GitHub
- URL: https://github.com/maxsonferovante/recognition_lambda_fuction
- Owner: maxsonferovante
- Created: 2025-02-03T00:15:06.000Z (4 months ago)
- Default Branch: main
- Last Pushed: 2025-02-05T00:02:01.000Z (4 months ago)
- Last Synced: 2025-02-13T01:42:33.495Z (4 months ago)
- Language: Python
- Homepage:
- Size: 30.3 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Lambda Function - Extrator de Texto PDF
[](https://github.com/maxsonferovante/recognition_lambda_fuction/actions/workflows/workflow_build.yaml)
## Sobre
Função AWS Lambda que processa PDFs através de eventos SQS, extraindo texto e salvando em JSON no S3.
## Funcionalidades
- Processamento assíncrono via SQS
- Extração de texto página por página
- Armazenamento estruturado em JSON
- Upload automático para S3## Requisitos
- Python 3.x
- Dependências:
- boto3
- pdfplumber
- requests## Estrutura de Dados
### Entrada (SQS Message)
```json
{
"recognition_id": "679d796b6795b4c2a8396eab",
"file_name": "documento.pdf",
"path_file": "https://TempLinkShare.s3.us-east-005.backblazeb2.com/tempLinkShape/679d7aa60879b7d112f7ba32/001_451_2024_edital_gratuidade_tecnico_(1).pdf"
}
```### Testes Locais
Para criar a lambda localmente usando Docker:
```
docker compose up --build --watch
```Para testar localmente usando o runtime da AWS Lambda:
```bash
curl -XPOST "http://localhost:9000/2015-03-31/functions/function/invocations" -d '{\"recognition_id\": \"679ff8dfc96fad021724501a\", \"file_name\": \"profile_(3).pdf\", \"extension\": \"pdf\", \"path_file\": \"https://TempLinkShare.s3.us-east-005.backblazeb2.com/tempLinkShape/679ff8dfc96fad021724501a/profile_(3).pdf\"}'
```Isso simula uma invocação da função Lambda em ambiente local.