https://github.com/pilarcode/receipt-ocr
Named entity recognition (NER). Extraction of features from images of receipts with different formats. #NER #OCR 🛒🏷️
https://github.com/pilarcode/receipt-ocr
flask-api ocr-python
Last synced: 10 months ago
JSON representation
Named entity recognition (NER). Extraction of features from images of receipts with different formats. #NER #OCR 🛒🏷️
- Host: GitHub
- URL: https://github.com/pilarcode/receipt-ocr
- Owner: pilarcode
- Created: 2021-06-08T14:38:13.000Z (over 4 years ago)
- Default Branch: main
- Last Pushed: 2024-02-03T12:30:56.000Z (almost 2 years ago)
- Last Synced: 2024-02-03T13:31:52.231Z (almost 2 years ago)
- Topics: flask-api, ocr-python
- Language: Jupyter Notebook
- Homepage:
- Size: 7.63 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Object Character Recognition(OCR) pytesseract
## Overview
- Este [notebook](https://github.com/pilarcode/notebooks/blob/dev/ocr_recibos_pytesseract.ipynb) contiene un experimento sobre las funcionales que podemos realizar con [Pytesseract](https://pypi.org/project/pytesseract/), una libreria open source para optical character recognition.
- También contiene un servicio web con [Flask](https://flask.palletsprojects.com/en/2.2.x/) que recibe una imagen codificada en base64 y realiza la extracción de caractéristicas de la imagen del recibo (precio item,descripción item, total). Ese servicio llama a servicios de AWS para la extracción de entidades y utiliza expresiones regulares en el prepocesamiento.
## Notes
Clasificar las compras nos permite predecir los gastos que realizará un cliente o realizar compras de forma automática.
- [x] Implementar un servicio web para el reconocimiento de texto en imágenes como alternativa al que ya se encuentra disponible en la plataforma de Aws que es de coste.
- [x] Explorar los datasets de facturas o recibos disponibles en el estado del arte para utilizarlo en nuestro caso de uso.
- [x] Tarea de extracción de datos. Dada una imagen de un recibo o ticket de compra obtener el nombre del establecimiento donde se realizo la compra, fecha de la compra y el listado de los productos (establecimiento, nombre producto, precio del producto) en formato texto.
- [ ] Tarea de almacenamiento: Guardar la información del fichero txt en una base de datos NoSQL ( por ejemplo: Amazon DynamoDB) para categorizar las compras.

## Resources
### OCR opensource
- Tesseract https://tesseract-ocr.github.io/ https://opensource.google/projects/tesseract
- Free OCR API https://ocr.space/ocrapi
- Top 5 https://rapidapi.com/blog/top-5-ocr-apis/
### Datasets
- SROIE2019 https://drive.google.com/drive/folders/1ShItNWXyiY1tFDM5W02bceHuJjyeeJl2
- FUNSD https://guillaumejaume.github.io/FUNSD/