https://github.com/celluloid-camp/vision
Video detection and analysis application, features person and object detection and tracking used in celluloid.me
https://github.com/celluloid-camp/vision
ai machine-learning mediapipe python3 vision-api vision-language-models
Last synced: 3 months ago
JSON representation
Video detection and analysis application, features person and object detection and tracking used in celluloid.me
- Host: GitHub
- URL: https://github.com/celluloid-camp/vision
- Owner: celluloid-camp
- Created: 2025-07-03T16:38:32.000Z (12 months ago)
- Default Branch: main
- Last Pushed: 2026-03-29T16:35:27.000Z (3 months ago)
- Last Synced: 2026-03-29T18:45:48.492Z (3 months ago)
- Topics: ai, machine-learning, mediapipe, python3, vision-api, vision-language-models
- Language: Python
- Homepage: https://celluloid.me
- Size: 6.09 MB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 7
-
Metadata Files:
- Readme: README-fr.md
- Changelog: CHANGELOG.md
Awesome Lists containing this project
README
## Celluloid Vision
Celluloid Vision utilise deux technologies principales d'intelligence artificielle pour l'analyse vidéo:
D'abord, MediaPipe, un framework open-source d'apprentissage automatique, assure la détection et le suivi des personnes et objets en temps réel.
Il s'appuie sur l'architecture EfficientDet-Lite0 avec un backbone EfficientNet-Lite0, entraînée sur le dataset COCO contenant 1,5 million d'instances réparties en 80 catégories d'objets.
Celluloid Vision implémente un système de box tracking qui combine l'inférence par réseaux de neurones avec des techniques classiques de vision par ordinateur : il extrait et suit des caractéristiques visuelles comme les coins à fort gradient à travers les images, les classifiant en éléments de premier plan et d'arrière-plan pour optimiser le suivi des objets.
Ensuite, PySceneDetect permet d'identifier automatiquement les transitions et les coupes entre les scènes vidéo.
L'application expose une API REST permettant le traitement asynchrone des vidéos avec un système de file d'attente, générant des résultats de détection au format JSON avec des données de suivi d'objets et des visualisations de timeline pour la plateforme celluloid.me.