Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/mendoc/reco

Outil d'archivage de fichiers
https://github.com/mendoc/reco

Last synced: 6 days ago
JSON representation

Outil d'archivage de fichiers

Awesome Lists containing this project

README

        

# Reco
Reco est un utilitaire pour archiver des fichiers.

## Présentation
Ce dépôt a pour but de présenter le projet, le fonctionnement, les cas d'usage et permettre à qui le souhaite de contribuer à son évolution.

## Constat
Parfois nous avons des fichiers, documents, etc. dans nos appareils que nous ne consultons pas tout le temps mais que nous ne pouvons pas ou ne voulons pas effacer à cause de leur importance. Nous nous retrouvons ainsi avec des fichiers qui occuppent notre espace disque sans trop savoir quoi en faire.

Plusieurs solutions s'offrent à nous. Nous pouvons enregistrer nos fichiers dans des serveurs en ligne qui mettent à notre disposition un espace de stockage. Compte tenu de l'espace qui nous alloué, nous sommes parfois obligés de faire le tri des documents à sauvegarder pour ne pas saturer rapidement la mémoire.

Une autre solution est de sauvegarder tous nos fichiers dans un disque dur externe.

**Reco** s'inscrit comme un solution supplémentaire. Il permettra de créer une version atomique de chaque fichier. En gros, il permet de faire passer un fichier de 1Go à un fichier de quelques centaines de Ko.

## Travail à faire
Pour réaliser cet utilitaire, il sera question de créer un modèle de machine learning.
- Type de problème : Classification
- Dataset :
- Lien de téléchargement : [Lien](https://raw.githubusercontent.com/mendoc/reco/master/dataset.csv)
- Taille : 100 000 lignes et 5 colonnes (1.5 Mo)
- Colonnes :
- 4 features : *Nombre de bits, Nombre de bits à 1, Rang dans la sous famille, Position du bit*
- 1 target : *Valeur*

Le but est de trouver le meilleur modèle possible qui pourra être généralisé pour prédire la valeur d'un bit (0 ou 1) en fonction des features renseignés.