https://github.com/kangfend/bahasa
Natural language toolkit for Indonesian Language (Bahasa)
https://github.com/kangfend/bahasa
bahasa indonesia natural-language-processing nlp nlp-python python sastrawi stemmer stemming
Last synced: about 1 month ago
JSON representation
Natural language toolkit for Indonesian Language (Bahasa)
- Host: GitHub
- URL: https://github.com/kangfend/bahasa
- Owner: kangfend
- License: mit
- Created: 2016-06-20T08:36:21.000Z (over 9 years ago)
- Default Branch: master
- Last Pushed: 2024-05-16T08:41:59.000Z (almost 2 years ago)
- Last Synced: 2026-01-01T19:29:05.627Z (about 2 months ago)
- Topics: bahasa, indonesia, natural-language-processing, nlp, nlp-python, python, sastrawi, stemmer, stemming
- Language: Python
- Homepage:
- Size: 120 KB
- Stars: 20
- Watchers: 1
- Forks: 10
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
- awesome-nlp - bahasa
- awesome-nlp - bahasa
README
BAHASA
======
Modul stemmer yang digunakan merupakan hasil _porting_ dari [Sastrawi](https://github.com/sastrawi/sastrawi) dengan beberapa perubahan.
INSTALASI
---------
Kita dapat menginstal bahasa dengan cara sebagai berikut:
```bash
pip install bahasa
```
PENGGUNAAN
----------
```python
from bahasa.stemmer import Stemmer
stemmer = Stemmer()
hasil = stemmer.stem("Saat ini pemerintah sedang memilih untuk menentukan rel yang digunakan.")
print(hasil)
saat ini perintah sedang pilih untuk tentu rel yang guna
hasil = stemmer.stem("membuang-buang waktu")
print(hasil)
buang waktu
# Menambahkan kata ke dalam kamus
stemmer.add_words("lauk", "nasi", "piring")
# Menghapus kata dalam kamus
stemmer.remove_words("ikan", "kucing")
```
TEST
----
```bash
python -m unittest discover
```