Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/regisdark/umbra
Application that allows you read dump file from PornHub for extracting files & tags for creating AI models
https://github.com/regisdark/umbra
ai image-classification nsfw nsfw-classifier pornhub tags
Last synced: 6 days ago
JSON representation
Application that allows you read dump file from PornHub for extracting files & tags for creating AI models
- Host: GitHub
- URL: https://github.com/regisdark/umbra
- Owner: regisdark
- License: mit
- Created: 2022-10-26T00:10:02.000Z (about 2 years ago)
- Default Branch: main
- Last Pushed: 2022-10-26T18:51:49.000Z (about 2 years ago)
- Last Synced: 2024-11-07T10:13:02.591Z (about 2 months ago)
- Topics: ai, image-classification, nsfw, nsfw-classifier, pornhub, tags
- Language: C#
- Homepage:
- Size: 16.6 KB
- Stars: 4
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# UMBRA Introduction & Use case (English)
While working on AI image classification, an obvious observation is needed, you need a lot of images for creating high precision models, this can be a difficult step, if you wish decent data source, in some times is needed to invest money, agreed totally on that, high quality data must have a just price. But for self-learning purposes, this can difficult new joiners to enter this area. UMBRA provide you a simple process for collecting & managing demo data for your Image related models.Taken a public access dump file from a solid source (PornHub), yes, using the public provided dump file you will have a decent, secure & high scalable data source for your model. Obviously, consider that: images in this file are NSFW, use them as your responsibility. UMBRA is focused in providing a software component for read this file & give you classes for managing info at these, data use is under your risk
Requeriments:
1. Enter at: https://es.pornhub.com/webmasters
2. Download file (.zip file)
3. Unzip file at your local.
4. Pass directory to UMBRA (line 16, at Program.cs)
5. Integrate UMBRA to your project & start training your models.# UMBRA Introduccion & Caso de uso (Español)
Mientras trabajas con modelos de clasificación de imágenes de IA, es necesario hacer una observación: necesitas muchas imágenes para crear modelos de alta precisión, este puede ser un paso difícil, ya que. Si deseas un origen de datos decente, en ocasiones necesitas invertir dinero, concuerdo totalmente con ello, la información de alta calidad debe tener un valor justo. Pero en los casos de auto-aprendizaje puede convertirse en factor para decidir si involucrarse en esta área. UMBRA provee un procedimiento simple para recolectar y administrar información de demostración para sus modelos relacionados a imágenes.Basado en un archivo de vaciado de acceso público, de un origen de datos solido (PornHub), asi es, usando su archivo de vaciado de acceso público tendrá un decente, seguro y altamente escalable origen de datos para sus modelos. Por supuesto, considere que: las imágenes en este archivo son NSFW, úselos bajo su responsabilidad. UMBRA se enfoca solamente a proveer un componente de software que le permita leer este archivo y darle las clases para administrar su información, el uso de los datos es bajo su propio riesgo.
Requerimentos:
1. Entre a: https://es.pornhub.com/webmasters
2. Descargue archivo de vaciado (archivo .zip)
3. Descomprima en su equipo.
4. Provea el directorio del archivo csv obtenido a UMBRA (linea 16, en Program.cs)
5. Integrue UMBRA a su proyecto e inicie a entrenar sus modelos.