https://github.com/upi-0/stemmid
stemming indonesian sentence.
https://github.com/upi-0/stemmid
sastrawi sastrawi-python stemmer
Last synced: 5 months ago
JSON representation
stemming indonesian sentence.
- Host: GitHub
- URL: https://github.com/upi-0/stemmid
- Owner: upi-0
- Created: 2025-06-22T13:41:19.000Z (12 months ago)
- Default Branch: main
- Last Pushed: 2025-10-25T11:30:57.000Z (8 months ago)
- Last Synced: 2025-10-25T13:17:32.234Z (8 months ago)
- Topics: sastrawi, sastrawi-python, stemmer
- Language: Python
- Homepage:
- Size: 103 KB
- Stars: 16
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: readme.md
Awesome Lists containing this project
README
# Stemmid
Proyek ini adalah implementasi stemmer Bahasa Indonesia berbasis daftar kata dasar. Stemmer digunakan untuk mengubah kata berimbuhan menjadi bentuk dasarnya.
Perbedaan dengan [PySastrawi](https://github.com/har07/PySastrawi):
- Source Code 100x lebih pendek.
- Algoritma yang digunakan berbeda.
- Lebih cepat hingga 10%.
- Kustomisasi kamus yang lebih uwaw.
## Install
```bash
pip install git+https://github.com/Malykz/stemmid
```
## Usage
### Initial
```python
>>> from stemmid import Stemmer
>>> Stemmer().load("menangis")
"tangis"
```
### Menambah kata ke Kamus
```python
>>> Stemmer().load("belajarlah")
"belajarlah"
>>> Stemmer(inc=["belajar"]).load("belajarlah")
"belajar"
```
### Mengecualikan Kata
```python
>>> Stemmer().load("menyusui")
"susu"
>>> Stemmer(exc=["susu"]).load("menyusui")
"menyusui"
```
### Menggunakan Kalimat
```python
>>> Stemmer().loads("Kehilangan Permainan")
"hilang main"
```
## Test
Test dengan 1825 kata :
- sastrawi = 0.03424
- stemmid = 0.02081
Test 1.825.000 kata (Cache) :
- sastrawi = 1.20500
- stemmid = 0.97979