Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/adhaamehab/arabicnlp
Python package for Arabic natural language processing
https://github.com/adhaamehab/arabicnlp
arabic arabic-nlp keras ml nlp part-of-speech-tagger postagging sequence-modeling
Last synced: 3 months ago
JSON representation
Python package for Arabic natural language processing
- Host: GitHub
- URL: https://github.com/adhaamehab/arabicnlp
- Owner: adhaamehab
- License: mit
- Created: 2019-03-02T19:50:30.000Z (almost 6 years ago)
- Default Branch: develop
- Last Pushed: 2019-06-12T18:12:07.000Z (over 5 years ago)
- Last Synced: 2024-09-27T13:40:41.700Z (3 months ago)
- Topics: arabic, arabic-nlp, keras, ml, nlp, part-of-speech-tagger, postagging, sequence-modeling
- Language: Python
- Size: 15.8 MB
- Stars: 24
- Watchers: 4
- Forks: 5
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
## Arabic Natural Language Processing
[![Build Status](https://travis-ci.com/adhaamehab/arabicnlp.svg?branch=develop)](https://travis-ci.com/adhaamehab/arabicnlp)
Arabic NLP is a python package that provides an implementation for natural language processing tasks for arabic language such as part-of-speech tagging, sentiment analysis, text similarity and more.
This projetc works as the backbone for [TextBlob ar](https://github.com/adhaamehab/textblob-ar)![books](./imgs/cover.jpeg)
### Installation
```shell
pip install arabicnlp
```### Usage
```python
from arabicnlp import tags, tokens, stemtags("العربية هي شبكة لنقل الاخبار و المعلومات و مقاطع الفيديو إلى عالم عبر عدة وسائط ، تشمل الانترنت و مواقع التواصل الاجتماعي")
'''
{'العربية': 'PART', 'هي': 'ADP', 'شبكة': 'PART', 'لنقل': 'NUM', 'الاخبار': 'SYM', 'و': 'ADP', 'المعلومات': 'SYM', 'مقاطع': 'NUM', 'الفيديو': 'SYM', 'إلى': 'NUM', 'عالم': 'NUM', 'عبر': 'ADP', 'عدة': 'ADP', 'وسائط': 'NUM', '،': 'SYM', 'تشمل': 'SYM', 'الانترنت': 'INTJ', 'مواقع': 'PART', 'التواصل': 'SYM', 'الاجتماعي': 'ADP'}
'''tokens("العربية هي شبكة لنقل الاخبار و المعلومات و مقاطع الفيديو إلى عالم عبر عدة وسائط ، تشمل الانترنت و مواقع التواصل الاجتماعي")
'''
['العربية', 'هي', 'شبكة', 'لنقل', 'الاخبار', 'و', 'المعلومات', 'و', 'مقاطع', 'الفيديو', 'إلى', 'عالم', 'عبر', 'عدة', 'وسائط', '،', 'تشمل', 'الانترنت', 'و', 'مواقع', 'التواصل', 'الاجتماعي']
'''stem("العربية هي شبكة لنقل الاخبار و المعلومات و مقاطع الفيديو إلى عالم عبر عدة وسائط ، تشمل الانترنت و مواقع التواصل الاجتماعي")
'''
['عرب', 'هي', 'شبك', 'لنقل', 'اخبار', 'و', 'معلوم', 'و', 'مقاطع', 'فيديو', 'الى', 'عالم', 'عبر', 'عد', 'سايط', '', 'تشمل', 'انتر', 'و', 'مواقع', 'تواصل', 'اجتماع']
'''```
### arabicnlp
- Arabicnlp is a natural language processing package for python developer
- Provides a minimal interface for most of basic algorithms
- Current release has:
* Tokenization.
* Stemming and lemmatization.
* Part-of-speech tagger### Known issue
- [tagger] Randomly some words that exists in word2index get msilabeled as `-PAD-`
## Blogs
- [Building the project](https://adhaamehab.me/2019/02/01/gp-docs.html)
- [Building an arabic part-of-speech based on sequence modeling](https://towardsdatascience.com/deep-learning-for-arabic-part-of-speech-tagging-810be7278353)### Contact
- [@adhaamehab](http://github.com/adhaamehab)## LICENSE
MIT License