Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/french-ai/french-nlp
Awesome list of resources about NLP applied to French | Liste de ressources liées au NLP appliqué au français
https://github.com/french-ai/french-nlp
List: french-nlp
awesome-list francais french language nlp
Last synced: 3 months ago
JSON representation
Awesome list of resources about NLP applied to French | Liste de ressources liées au NLP appliqué au français
- Host: GitHub
- URL: https://github.com/french-ai/french-nlp
- Owner: french-ai
- Created: 2020-06-16T11:42:43.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2020-06-16T13:36:52.000Z (over 4 years ago)
- Last Synced: 2024-05-20T03:00:39.922Z (7 months ago)
- Topics: awesome-list, francais, french, language, nlp
- Homepage:
- Size: 20.5 KB
- Stars: 45
- Watchers: 6
- Forks: 6
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
French NLP
Liste de ressources liées au NLP appliqué au français
Version française
•
English version# Sommaire
- [Modèles](#modèles)
- [Librairies](#librairies)
- [Analyse de sentiment](#analyse-de-sentiment)
- [Code](#code)
- [Jeux de données](#jeux-de-données)
- [Articles](#articles)
- [Génération de texte](#génération-de-texte)
- [Code](#code-1)
- [Jeux de données](#jeux-de-données-1)
- [Articles](#articles-1)
- [Classification de texte](#classification)
- [Code](#cod-2)
- [Jeux de données](#jeux-de-données-2)
- [Articles](#articles-2)
- [Réponses aux questions](#réponses-aux-questions)
- [Code](#code-3)
- [Jeux de données](#jeux-de-données-3)
- [Articles](#articles-3)
- [Traduction](#traduction)
- [Code](#code-4)
- [Jeux de données](#jeux-de-données-4)
- [Articles](#articles-4)
- [Résumé de texte](#résumé-de-texte)
- [Code](#code-5)
- [Jeux de données](#jeux-de-données-5)
- [Articles](#articles-5)
- [Contribuer](#contribuer)
- [Autres](#autres)---
# Modèles
* [CamemBERT](https://camembert-model.fr/) - A tasty French Language Model.
* [FlauBERT](https://github.com/getalp/Flaubert) - Unsupervised Language Model Pre-training for French.
* [Deepfrench](https://github.com/tchambon/deepfrench) - French LM implementation of ULMFiT.# Librairies
* [Transformers](https://github.com/huggingface/transformers)
* [SpaCy](https://spacy.io/models/fr)
* [NLTK](https://www.nltk.org/)
* [Gensim](https://radimrehurek.com/gensim/)# Analyse de sentiment
### Code
* [french-sentiment-analysis-with-bert](https://github.com/TheophileBlard/french-sentiment-analysis-with-bert) - Analyse de sentiments avec BERT.
### Jeux de données
* [Allociné](https://github.com/TheophileBlard/french-sentiment-analysis-with-bert) - Allociné user reviews.
* [Aspect-Based Sentiment Analysis in French](http://www.lrec-conf.org/proceedings/lrec2016/summaries/61.html) - Contient 457 avis de restaurants et 162 de musées.### Articles
A
# Génération de texte
### Code
* [GPT2 French](https://github.com/aquadzn/gpt2-french) - Démo française de GPT-2.
### Jeux de données
* [Reddit français](https://www.kaggle.com/breandan/french-reddit-discussion) - Posts sur le sub français de Reddit.
### Articles
A
# Classification de texte
### Code
* [Deepfrench classifier](https://github.com/tchambon/deepfrench/blob/master/ULMFit%20Classifier%20example.ipynb) - Classification avec Deepfrench.
### Jeux de données
* [FLUE](https://github.com/getalp/Flaubert/tree/master/flue#1-text-classification-cls) - Classification de texte.
### Articles
# Réponses aux questions
### Code
* [FQuAD](https://illuin-tech.github.io/FQuAD-explorer/) - The French Question Answering Dataset.
### Jeux de données
* [FQuAD](https://illuin-tech.github.io/FQuAD-explorer/) - The French Question Answering Dataset.
### Articles
# Traduction
### Code
* [EN-FR](https://github.com/deep-diver/EN-FR-MLT-tensorflow) - Traduction machine EN-FR avec Tensorflow
### Jeux de données
* [Aligned Hansards of the 36th Parliament of Canada](https://www.isi.edu/natural-language/download/hansard/) - 1.3 millions de phrases en anglais et en français.
* [Chinese-French Text](https://catalog.ldc.upenn.edu/LDC2018T17) - Un corpus d'environ 30000 caractères chinois vers le français.
* [French-Arabic Newspapers](http://catalog.elra.info/en-us/repository/browse/ELRA-W0100/) - Un corpus de 10000 mots issus d'articles arabes et 2 traductions en français.
* [Europarl English-French Machine Translation Dataset](https://datarepository.wolframcloud.com/resources/Europarl-English-French-Machine-Translation-Dataset-V7) - Corpus de texte issu du Parlement Européen entre 1996 et 2011.
* [German-French website parallel corpus](https://data.europa.eu/euodp/en/data/dataset/elrc_42) - Corpus de texte allemand traduit en français
* [Spanish-French website parallel corpus](https://data.europa.eu/euodp/en/data/dataset/elrc_338) - Corpus de texte espagnol traduit en français
### Articles
A
# Résumé de texte
### Code
### Jeux de données
* [Articles de journaux français](https://webhose.io/free-datasets/french-news-articles/) - Articles avec titres et textes complets
### Articles
A
# Contribuer
Les contributions sont les bienvenues!
[Vous pouvez éditer le README](https://github.com/french-ai/french-nlp/edit/master/README.md)- - -
Si vous avez des questions, n'hésitez pas à me contacter: [@aquadzn](https://github.com/aquadzn)