https://github.com/jsastrawi/jsastrawi
Natural Language Processing (NLP) Tools for Bahasa Indonesia
https://github.com/jsastrawi/jsastrawi
Last synced: 4 months ago
JSON representation
Natural Language Processing (NLP) Tools for Bahasa Indonesia
- Host: GitHub
- URL: https://github.com/jsastrawi/jsastrawi
- Owner: jsastrawi
- License: mit
- Created: 2015-07-12T05:40:54.000Z (almost 11 years ago)
- Default Branch: master
- Last Pushed: 2016-10-15T14:36:07.000Z (over 9 years ago)
- Last Synced: 2023-07-26T21:15:00.683Z (almost 3 years ago)
- Language: Java
- Size: 161 KB
- Stars: 29
- Watchers: 3
- Forks: 15
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
- awesome-java - JSastrawi
README
JSastrawi
=========
[](https://travis-ci.org/jsastrawi/jsastrawi)
[](http://search.maven.org/#search%7Cga%7C1%7Cg%3A%22com.andylibrian.jsastrawi%22%20AND%20a%3A%22jsastrawi%22)
[](https://www.versioneye.com/user/projects/55b2c8d6643533001b0006b4)
JSastrawi is a collection of Natural Language Processing (NLP) tools for Bahasa Indonesia.
It is originally a java port of [Sastrawi Stemmer](https://github.com/sastrawi/sastrawi).
Components
----------
JSastrawi terdiri dari beberapa komponen yaitu:
#### Lemmatizer
*[Lemmatization](https://en.wikipedia.org/wiki/Lemmatisation)* ialah proses mengubah kata berimbuhan menjadi kata dasar. Seperti:
- menahan => tahan
- berbalas-balasan => balas
Tersedia demo pada [http://sastrawi.github.io](http://sastrawi.github.io)
Cara Install
------------
### Maven
```xml
com.andylibrian.jsastrawi
jsastrawi
0.1
```
### Gradle
```
compile 'com.andylibrian.jsastrawi:jsastrawi:0.1'
```
### Jar
- https://github.com/jsastrawi/jsastrawi/releases
Cara Menggunakan
----------------
### Lemmatizer
```java
// Mulai setup JSastrawi, cukup dijalankan 1 kali
// JSastrawi lemmatizer membutuhkan kamus kata dasar
// dalam bentuk Set
Set dictionary = new HashSet();
// Memuat file kata dasar dari distribusi JSastrawi
// Jika perlu, anda dapat mengganti file ini dengan kamus anda sendiri
InputStream in = Lemmatizer.class.getResourceAsStream("/root-words.txt");
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String line;
while ((line = br.readLine()) != null) {
dictionary.add(line);
}
Lemmatizer lemmatizer = new DefaultLemmatizer(dictionary);
// Selesai setup JSastrawi
// lemmatizer bisa digunakan berkali-kali
System.out.println(lemmatizer.lemmatize("memakan"));
System.out.println(lemmatizer.lemmatize("meminum"));
System.out.println(lemmatizer.lemmatize("bernyanyi"));
```
Lisensi
--------
[Lisensi JSastrawi](https://github.com/jsastrawi/jsastrawi/blob/master/LICENSE) adalah MIT License (MIT).
Produk ini mengandung software yang dibangun oleh Apache Software Foundation ([http://www.apache.org](http://www.apache.org)).
Produk ini menggunakan pustaka CLI dari Apache Commons project ([http://commons.apache.org](http://commons.apache.org)).
Produk ini mengandung kamus kata dasar yang berasal dari Kateglo dengan lisensi [CC-BY-NC-SA 3.0](http://creativecommons.org/licenses/by-nc-sa/3.0/), kemudian dilakukan beberapa perubahan.