https://github.com/gip-recia/karuta-csv-processing

Scripts de traitement des csv fourni par les université à destination des batch Karuta
https://github.com/gip-recia/karuta-csv-processing

Last synced: 3 months ago
JSON representation

Scripts de traitement des csv fourni par les université à destination des batch Karuta

Host: GitHub
URL: https://github.com/gip-recia/karuta-csv-processing
Owner: GIP-RECIA
License: apache-2.0
Created: 2022-01-03T18:06:16.000Z (over 3 years ago)
Default Branch: main
Last Pushed: 2025-01-07T07:42:10.000Z (5 months ago)
Last Synced: 2025-01-07T08:46:41.937Z (5 months ago)
Language: Perl
Size: 163 KB
Stars: 0
Watchers: 5
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

# karuta-csv-processing
Scripts de traitement des csv fourni par les universités à destination des batch Karuta.

La spécification des traitements est décrite dans [specifications_script_traitement_csv](specifications_script_traitement_csv.md)

#### usage :

./workIn.pl WORKING_DIR
où WORKING_DIR est le répertoire de travail.

WORKING_DIR doit contenir le fichier *karuta.properties* de paramétrage du script.
Tout fichier, téléchargé ou calculé, serra placé dans ce répertoire.

#### Paramètres dans *karuta.properties*

- log.file: Fichier de log (défaut : WORKING_DIR/karuta.log).

- ftp.addr: Adresse du serveur sftp pour récupérer les fichiers.zip à traiter.
De la forme [email protected].

- annee.scolaire: année scolaire sur 4 chiffres

- univ.list: liste des universités à traiter; noms courts en minuscules. Désignés ci-dessous par *__nomUniv__*.

- *__nomUniv__*.ftp.rep: nom du repertoire dans ftp de l'université *__nomUniv__*

- *__nomUniv__*.file.prefix: prefix des fichiers de l'université *__nomUniv__*

##### Les paramètres facultatifs
si on ne veut pas récupérer un nouveau .zip mais travailler sur un déjà reçu et dézipé

- *__nomUniv__*.test.newPath: nom du répertoire déziper en entrée.

le fichier *karuta.data* contient les derniers fichiers traiter pour chaques univ: utile pour faire le calcul des différences.

- *__nomUniv__*.test.oldPath: nom de l'ancien répertoire sur lequel on va se basé pour calculer les différences sans tenir compte du karuta.data

#### Les resultats
Pour chaque université on récupère du sftp le dernier fichier non déjà présent dans WORKING_DIR.
Pour chaque fichier récupéré un fichier.zip est créé dans WORKING_DIR prefixé par *_nomUniv_* et terminant par la date.
Il contient les fichiers reçu et les fichiers créés (dans le répertoire *__nomUniv__*_diff).

A la racine de l'archive il y a aussi création d'un fichier de log contenant les lignes en entrées rejetées (non conforme).

#### Contenu des archives resultat ( nomUniv_date.zip)

- le repertoire des données reçu tel quelles : *__nomUniv__*_*__date__*
- le repertoire avec les fichiers calculés : *__nomUniv__*_*__date__*\_diff

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/gip-recia/karuta-csv-processing

Awesome Lists containing this project

README