An open API service indexing awesome lists of open source software.

https://github.com/undertheseanlp/preprocess


https://github.com/undertheseanlp/preprocess

Last synced: 2 months ago
JSON representation

Awesome Lists containing this project

README

        

Các bước tiền xử lý dữ liệu văn bản

- Chuẩn hóa unicode (unicode tổ hợp và dựng sẵn)
- Chuẩn hóa ký tự
- Chuẩn hóa dấu
- Loại bỏ các ký tự đặc biệt (thẻ html, ...)

- File Loading
- Tách từ
- Vocab
- Numericalize/Indexify
- Word Vector
- Batching
- Embedding Lookup

Tham khảo

* [A Tutorial on Torchtext](http://anie.me/On-Torchtext/)