Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/jean-baptiste-camps/geste
Un corpus de chansons de geste
https://github.com/jean-baptiste-camps/geste
corpus corpus-data lemmatization old-french pos-tagging xml-tei
Last synced: about 6 hours ago
JSON representation
Un corpus de chansons de geste
- Host: GitHub
- URL: https://github.com/jean-baptiste-camps/geste
- Owner: Jean-Baptiste-Camps
- Created: 2016-03-23T17:35:00.000Z (over 8 years ago)
- Default Branch: master
- Last Pushed: 2021-09-14T09:24:57.000Z (about 3 years ago)
- Last Synced: 2024-10-12T21:44:05.158Z (about 1 month ago)
- Topics: corpus, corpus-data, lemmatization, old-french, pos-tagging, xml-tei
- Language: HTML
- Homepage:
- Size: 216 MB
- Stars: 4
- Watchers: 3
- Forks: 6
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Geste
Un corpus de chansons de geste.
*Ki volt oïr chançun de beau semblant*
*Dunt bien sunt fait les vers par consonant*
*Ore laist la noise si se treie avant*
*Dirun la flur de la geste vallant****
Les développements présentés ici ont été entrepris dans le cadre de la thèse de doctorat de Jean-Baptiste Camps (Univ. Paris-Sorbonne)\[1\], et ont été poursuivis collaborativement, en bénéficiant des financements des projets,
- LAKME (*Linguistically Annotated Corpora Using Machine Learning Techniques*, ENS/EPHE/ENC | PSL; financement PSL, 2016-2018)
- OMÉLiE (*Outils et méthodes pour l'édition linguistique enrichie*; ENC/ENS; financements Scripta-PSL et DIM «Sciences du texte et connaissances nouvelles»).\[1\]: Jean-Baptiste Camps, _La Chanson d’Otinel: édition complète du corpus manuscrit et prolégomènes à l’édition critique_, thèse de doct., dir. Dominique Boutet, Univ. Paris-Sorbonne, 2016.
***
Les textes médiévaux sont du domaine public.
Medieval texts are free of known copyright restrictions.
Le reste est mis à disposition selon une licence Creative Commons Attribution - Partage dans les Mêmes Conditions 4.0 International (CC BY-SA 4.0).
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.***
## Citer ce corpus / Cite this corpus:
_Geste: un corpus de chansons de geste_, dir. Jean-Baptiste Camps, avec la collab. d'Elena Albarran, Alice Cochet & Lucence Ing, Paris, 2016-…, DOI: [10.5281/zenodo.1744918](https://doi.org/10.5281/zenodo.1744918), http://github.com/Jean-Baptiste-Camps/Geste.
## Publication en ligne
Une version bêta de la publication en ligne est disponible sur **le serveur de développement des éditions en ligne de l'École des chartes, [http://dev.chartes.psl.eu/elec/geste/](http://dev.chartes.psl.eu/elec/geste/).**
## Organisation de l'entrepôt
Les documents, dans leur représentation canonique, sont contenus dans les dossiers:
- `xml_gold`: textes du corpus geste: éditions numérisées (ed\_), transcriptions à nouveaux frais (transcr\_), avec annotation linguistique revue;
- `xml_silver`: textes du corpus geste à l'annotation linguistique non revue;
- `xml_src`: documents de travail, notamment sources des transcriptions allographétiques.Le modèle est contenu dans le dossier:
- `odd`
Les données sont en outre disponibles en format:
- `tsv`: avec l'annotation linguistique;
- `txt`: exports en texte brut.L'archive contient également:
- `css`: des feuilles de style pour les documents xml;
- `doc`: de la documentation sur l'annotation linguistique;
- `dtd`: les entités utilisées pour les éditions allographétiques;
- `xsl`: des feuilles de transformation et exports variés des données.