An open API service indexing awesome lists of open source software.

https://github.com/ediloaz/market-web-scrapping


https://github.com/ediloaz/market-web-scrapping

automation market python scraping-websites

Last synced: 11 months ago
JSON representation

Awesome Lists containing this project

README

          

# Lista de Tareas

## Imágenes
- [x] Remover el enlace de las imágenes.
- [ ] Subirlas conforme se van descargando.
- [ ] Definir la estructura y flujo de cómo manejar estas imágenes (Considerar la posibilidad de carga diferida desde otro sitio gratuito (Google Drive, por ejemplo)).
- [ ] Hacer público los datos al utilizar la página.

## JSONs
- [ ] Crear MultiJsons para manejarlos en un sitio web estático.

## WebSite
- [ ] Primera versión del WebSite, muestra un listado de todos los perfumes del JSON.

## Mejor continúa
- [ ] Obtener los demás atributos.
- [ ] Observar los datos y detectar patrones.
- [ ] Conectar con Inteligencia Artificial para, mediante un trabajo programado, mejorar periódicamente la descripción, detalles o atributos de los perfumes.
- [ ] Conectar con otras páginas y fusionar datos de los mismos perfumes.
- [ ] Resolver cómo conseguir imágenes de alta calidad.

## Ejemplo del archivo .env
SITEMAP_URL=https://website.com/wp-sitemap.xml
AWS_ACCESS_KEY_ID=AAA
AWS_SECRET_ACCESS_KEY=BBB
REGION=us-west-2
OUTPUT=json
BUCKET_NAME=images