https://github.com/saidziani/mastersthesis
Avec l'émergence des TIC et la démocratisation de la production de contenu sur internet, on assiste à un tsunami informationnel. Ce dernier est très difficile à gérer manuellement, et même les outils informatiques classiques peinent à offrir des résultats concluants. Les journaux et les sites d'information contribuent pleinement à ce contenu, ce qui rend la revue de presse quotidienne dure à appréhender. Notre projet, propose un outil sophistiqué qui prend en considération les centres d'intérêt de chaque utilisateur, afin de lui suggérer les articles les plus pertinents de la presse algérienne et internationale, et ce dans les deux langues (Arabe et Anglais). Ceci est accompli en utilisant des techniques d'intelligence artificielle, de traitement automatique du langage et d'apprentissage automatique. Mots clés : Traitement automatique du langage naturel, catégorisation de textes, corpus de résumé automatique, résumé automatique, traduction automatique, profilage d'utilisateurs, recommandation d'articles de presse.
https://github.com/saidziani/mastersthesis
arabic-nlp master nlp-machine-learning recommander-system thesis
Last synced: 4 months ago
JSON representation
Avec l'émergence des TIC et la démocratisation de la production de contenu sur internet, on assiste à un tsunami informationnel. Ce dernier est très difficile à gérer manuellement, et même les outils informatiques classiques peinent à offrir des résultats concluants. Les journaux et les sites d'information contribuent pleinement à ce contenu, ce qui rend la revue de presse quotidienne dure à appréhender. Notre projet, propose un outil sophistiqué qui prend en considération les centres d'intérêt de chaque utilisateur, afin de lui suggérer les articles les plus pertinents de la presse algérienne et internationale, et ce dans les deux langues (Arabe et Anglais). Ceci est accompli en utilisant des techniques d'intelligence artificielle, de traitement automatique du langage et d'apprentissage automatique. Mots clés : Traitement automatique du langage naturel, catégorisation de textes, corpus de résumé automatique, résumé automatique, traduction automatique, profilage d'utilisateurs, recommandation d'articles de presse.
- Host: GitHub
- URL: https://github.com/saidziani/mastersthesis
- Owner: saidziani
- Created: 2018-02-23T08:24:14.000Z (over 8 years ago)
- Default Branch: master
- Last Pushed: 2019-01-13T14:38:04.000Z (over 7 years ago)
- Last Synced: 2025-07-07T19:01:30.641Z (11 months ago)
- Topics: arabic-nlp, master, nlp-machine-learning, recommander-system, thesis
- Language: TeX
- Homepage:
- Size: 28.7 MB
- Stars: 13
- Watchers: 1
- Forks: 2
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Mémoire de fin d'études de Master Informatique - parcours Systèmes Informatiques Intelligents
## Réalisation d'un outil de revue de presse personnalisée
------------------------------
------------------------------
## Résumé
Avec l'émergence des TIC et la démocratisation de la production de contenu sur internet, on assiste à un tsunami informationnel. Ce dernier est très difficile à gérer manuellement, et même les outils informatiques classiques peinent à offrir des résultats concluants. Les journaux et les sites d'information contribuent pleinement à ce contenu, ce qui rend la revue de presse quotidienne dure à appréhender.
Notre projet, propose un outil sophistiqué qui prend en considération les centres d'intérêt de chaque utilisateur, afin de lui suggérer les articles les plus pertinents de la presse algérienne et internationale, et ce dans les deux langues (Arabe et Anglais). Ceci est accompli en utilisant des techniques d'intelligence artificielle, de traitement automatique du langage et d'apprentissage automatique.
Mots clés : Traitement automatique du langage naturel, catégorisation de textes, corpus de résumé
automatique, résumé automatique, traduction automatique, profilage d'utilisateurs, recommandation d'articles de presse.
##
ملخص
مع بروز تكنولوجيا الإعلام و الإتصال و دمقرطة محتوى صفحات الأنترنت، أصبح التحكم في الكم الهائل من المعلومات صعبا للغاية، سواءا يدويا أو حتى باستعمال أنظمة معلوماتية. وتساهم الصحف و المواقع الإخبارية بشكل مباشر في تزايد المحتوى، مما يجعل الإطلاع على الأخبار أمرا متعبا يتطلب الكثير من الوقت.
لمعالجة هذه الإشكالية، نقترح في مشروعنا تطبيقا يأخذ بعين الإعتبار اههتمامات المستخدمين بهدف اقتراح مقالات من الصحافة الجزائرية و الدولية باللغتين العربية و الإنجليزية تلبي رغبة القارئ، و هذا باستخدام تقنيات الذكاء الإصطناعي و المعالجة الآلية للنصوص.
الكلمات الدالة : المعالجة الآلية للغات، تصنيف النصوص، تلخيص النصوص، الترجمة الآلية، التوصية.
## Abstract
The Internet plays an increasingly important part in our daily lives as a source of written content for news and leisure. Yet it is tedious and difficult to sort through this staggering flow of information and stay updated with changes in our world, even using automated tools.
Reading magazines and newspapers is too time-consuming, and there is a huge amount of online content that is updated or generated each minute.
Our solution considers each user's interests and leverages Artificial Intelligence, Machine Learning and Natural Language Processing in order to suggest to relevant articles from the internet.
Keywords : Natural Language Processing, Text classification, Automatic summarization corpora, Automatic summarization, Machine translation, User profiling, News recommendation.
-------------------------------------
## Réalisation
* Backend :
- API: [github.com/saidziani/Simple-Flask-API](https://github.com/saidziani/Simple-Flask-API)
- NoSQL Database: WIP
* Models :
- Arabic News Article Classification: [github.com/saidziani/Arabic-News-Article-Classification](https://github.com/saidziani/Arabic-News-Article-Classification)
- Automatic Text Summarization: [github.com/saidziani/Sumrized](https://github.com/saidziani/sumrized)
* Frontend :
- Feedny: [github.com/saidziani/Feedny](https://github.com/saidziani/feedny)