Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/french-ai/french-nlp

Awesome list of resources about NLP applied to French | Liste de ressources liées au NLP appliqué au français
https://github.com/french-ai/french-nlp

List: french-nlp

awesome-list francais french language nlp

Last synced: 3 months ago
JSON representation

Awesome list of resources about NLP applied to French | Liste de ressources liées au NLP appliqué au français

Awesome Lists containing this project

README

        





French NLP Image



French NLP


Liste de ressources liées au NLP appliqué au français


Version française

English version

# Sommaire

- [Modèles](#modèles)
- [Librairies](#librairies)
- [Analyse de sentiment](#analyse-de-sentiment)
- [Code](#code)
- [Jeux de données](#jeux-de-données)
- [Articles](#articles)
- [Génération de texte](#génération-de-texte)
- [Code](#code-1)
- [Jeux de données](#jeux-de-données-1)
- [Articles](#articles-1)
- [Classification de texte](#classification)
- [Code](#cod-2)
- [Jeux de données](#jeux-de-données-2)
- [Articles](#articles-2)
- [Réponses aux questions](#réponses-aux-questions)
- [Code](#code-3)
- [Jeux de données](#jeux-de-données-3)
- [Articles](#articles-3)
- [Traduction](#traduction)
- [Code](#code-4)
- [Jeux de données](#jeux-de-données-4)
- [Articles](#articles-4)
- [Résumé de texte](#résumé-de-texte)
- [Code](#code-5)
- [Jeux de données](#jeux-de-données-5)
- [Articles](#articles-5)
- [Contribuer](#contribuer)
- [Autres](#autres)

---

# Modèles

* [CamemBERT](https://camembert-model.fr/) - A tasty French Language Model.
* [FlauBERT](https://github.com/getalp/Flaubert) - Unsupervised Language Model Pre-training for French.
* [Deepfrench](https://github.com/tchambon/deepfrench) - French LM implementation of ULMFiT.

# Librairies

* [Transformers](https://github.com/huggingface/transformers)
* [SpaCy](https://spacy.io/models/fr)
* [NLTK](https://www.nltk.org/)
* [Gensim](https://radimrehurek.com/gensim/)

# Analyse de sentiment

### Code

* [french-sentiment-analysis-with-bert](https://github.com/TheophileBlard/french-sentiment-analysis-with-bert) - Analyse de sentiments avec BERT.

### Jeux de données

* [Allociné](https://github.com/TheophileBlard/french-sentiment-analysis-with-bert) - Allociné user reviews.
* [Aspect-Based Sentiment Analysis in French](http://www.lrec-conf.org/proceedings/lrec2016/summaries/61.html) - Contient 457 avis de restaurants et 162 de musées.

### Articles

A

# Génération de texte

### Code

* [GPT2 French](https://github.com/aquadzn/gpt2-french) - Démo française de GPT-2.

### Jeux de données

* [Reddit français](https://www.kaggle.com/breandan/french-reddit-discussion) - Posts sur le sub français de Reddit.

### Articles

A

# Classification de texte

### Code

* [Deepfrench classifier](https://github.com/tchambon/deepfrench/blob/master/ULMFit%20Classifier%20example.ipynb) - Classification avec Deepfrench.

### Jeux de données

* [FLUE](https://github.com/getalp/Flaubert/tree/master/flue#1-text-classification-cls) - Classification de texte.

### Articles

# Réponses aux questions

### Code

* [FQuAD](https://illuin-tech.github.io/FQuAD-explorer/) - The French Question Answering Dataset.

### Jeux de données

* [FQuAD](https://illuin-tech.github.io/FQuAD-explorer/) - The French Question Answering Dataset.

### Articles

# Traduction

### Code

* [EN-FR](https://github.com/deep-diver/EN-FR-MLT-tensorflow) - Traduction machine EN-FR avec Tensorflow

### Jeux de données

* [Aligned Hansards of the 36th Parliament of Canada](https://www.isi.edu/natural-language/download/hansard/) - 1.3 millions de phrases en anglais et en français.

* [Chinese-French Text](https://catalog.ldc.upenn.edu/LDC2018T17) - Un corpus d'environ 30000 caractères chinois vers le français.

* [French-Arabic Newspapers](http://catalog.elra.info/en-us/repository/browse/ELRA-W0100/) - Un corpus de 10000 mots issus d'articles arabes et 2 traductions en français.

* [Europarl English-French Machine Translation Dataset](https://datarepository.wolframcloud.com/resources/Europarl-English-French-Machine-Translation-Dataset-V7) - Corpus de texte issu du Parlement Européen entre 1996 et 2011.

* [German-French website parallel corpus](https://data.europa.eu/euodp/en/data/dataset/elrc_42) - Corpus de texte allemand traduit en français

* [Spanish-French website parallel corpus](https://data.europa.eu/euodp/en/data/dataset/elrc_338) - Corpus de texte espagnol traduit en français

### Articles

A

# Résumé de texte

### Code

### Jeux de données

* [Articles de journaux français](https://webhose.io/free-datasets/french-news-articles/) - Articles avec titres et textes complets

### Articles

A

# Contribuer

undraw-active-support-6rwo

Les contributions sont les bienvenues!
[Vous pouvez éditer le README](https://github.com/french-ai/french-nlp/edit/master/README.md)

- - -

Si vous avez des questions, n'hésitez pas à me contacter: [@aquadzn](https://github.com/aquadzn)