Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/diplodoc-platform/sentenizer

sentenizer — rule-based NLP library for sentence segmentation with russian language support
https://github.com/diplodoc-platform/sentenizer

Last synced: about 2 months ago
JSON representation

sentenizer — rule-based NLP library for sentence segmentation with russian language support

Awesome Lists containing this project

README

        

# sentenizer
sentenizer — rule-based NLP library for sentence segmentation with **russian language** support

## api

### sentenize
takes text of type `string` and returns segmented sentences as `string[]`

#### type
```
sentenize :: string -> string[]
```

## usage
```
const {sentenize} = require('sentenizer');

const text = 'Он купил фрукты - яблоки, бананы, и т. д. все были очень рады угощению. Вот такой он добродушный наш родственник И. В. Иванов.';

const sentences = sentenize(text);
// sentences:
// [
// 'Он купил фрукты - яблоки, бананы, и т. д. все были очень рады угощению.',
// 'Вот такой он добродушный наш родственник И. В. Иванов.'
// ]
```