https://github.com/icelaterdc/turk-nlp
Türkçe için kapsamlı açık kaynak NLP (Doğal Dil İşleme) kütüphanesi.
https://github.com/icelaterdc/turk-nlp
computational-linguistics deep-learning huggingface language-processing lemmatization machine-learning morphology natural-language-processing ner nlp open-source pos-tagging python sentiment-analysis text-mining text-summarization tokenization transformers turkish turkish-nlp
Last synced: 3 months ago
JSON representation
Türkçe için kapsamlı açık kaynak NLP (Doğal Dil İşleme) kütüphanesi.
- Host: GitHub
- URL: https://github.com/icelaterdc/turk-nlp
- Owner: icelaterdc
- License: mit
- Created: 2025-05-31T16:54:05.000Z (4 months ago)
- Default Branch: main
- Last Pushed: 2025-05-31T17:23:04.000Z (4 months ago)
- Last Synced: 2025-06-09T07:56:44.971Z (4 months ago)
- Topics: computational-linguistics, deep-learning, huggingface, language-processing, lemmatization, machine-learning, morphology, natural-language-processing, ner, nlp, open-source, pos-tagging, python, sentiment-analysis, text-mining, text-summarization, tokenization, transformers, turkish, turkish-nlp
- Language: Python
- Homepage:
- Size: 20.5 KB
- Stars: 2
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# TurkNLP – Geniş Kapsamlı Türkçe Doğal Dil İşleme (NLP) Kütüphanesi
TurkNLP, Türkçe dili için sıfırdan geliştirilmiş, modüler yapıya sahip, genişletilebilir ve modern bir doğal dil işleme (NLP) kütüphanesidir. Amaç; hem akademik çalışmalarda hem de endüstriyel projelerde Türkçe NLP alanındaki ihtiyaçlara açık kaynaklı bir çözüm sunmaktır.
## Özellikler
* ✨ **Tokenizasyon**: Türkçeye uygun kelime ve cümle ayırma
* 🧠 **Morfolojik Çözümleme**: Ek ayrıştırma ve kök bulma
* 🔎 **POS Tagging**: Kelime türü etiketleme
* 🧾 **Ad Öbeği Çıkarımı (NER)**: Kişi, kurum, yer vs. tanıma
* ⚖️ **Duygu Analizi**: Türkçeye uygun olumlu/olumsuz duygu sınıflandırma
* 📚 **Leksik Analiz**: Sözlük tabanlı yapı ve anlamsal analiz
* 🤖 **Transformer Entegrasyonu**: Huggingface destekli modellerle çalışma
* ⚙️ **Modüler Mimari**: Her modül bağımsız ve entegre çalışabilir
* 🧪 **CLI ve API desteği**: Komut satırı ve REST API üzerinden kullanım## Kurulum
Bu proje [Poetry](https://python-poetry.org/) ile yapılandırılmıştır. Eğer Poetry yüklü değilse:
```bash
pip install poetry
```Projeyi kurmak için:
```bash
git clone https://github.com/icelaterdc/Turk-NLP.git
cd Turk-NLP
poetry install
```## Temel Kullanım
```python
from turknlp.tokenization import TurkishTokenizer
from turknlp.morphology import MorphAnalyzertext = "Ankara'da hava oldukça güzel."
tokens = TurkishTokenizer().tokenize(text)
morphs = MorphAnalyzer().analyze(tokens)for token, morph in zip(tokens, morphs):
print(token, morph)
```## Transformer Destekli Modeller
```python
from turknlp.transformers import TurkishBERTNER
model = TurkishBERTNER()
result = model.predict("Mustafa Kemal Atatürk Türkiye Cumhuriyeti'nin kurucusudur.")
print(result)
```## Testler
```bash
poetry run pytest tests/
```## Yol Haritası
* [x] Tokenizer
* [x] Morfolojik analiz
* [x] POS tagging
* [x] NER
* [x] Sentiment
* [x] Transformer destek
* [ ] Bağlam bazlı anlambilim (WSD)
* [ ] Dil modeli destekli metin üretimi## Katkı
Projeye katkı sağlamak için forkladıktan sonra PR gönderebilirsiniz:
```bash
git clone https://github.com/icelaterdc/Turk-NLP.git
cd Turk-NLP
git checkout -b yeni-ozellik
```## Lisans
MIT Lisansı ile lisanslanmıştır.
---
> "TurkNLP, Türkçeye özel geliştirilen açık kaynak NLP araçları için güçlü bir temel sunmayı hedefler."