Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/bilgenurbekar/turkishcyberbullying
Contains fine-tuned BERT models and results in the text classification category using Turkish social media data
https://github.com/bilgenurbekar/turkishcyberbullying
bert-fine-tuning huggingface-transformers matplotlib numpy pandas python pytorch scikit-learn transformers
Last synced: about 1 month ago
JSON representation
Contains fine-tuned BERT models and results in the text classification category using Turkish social media data
- Host: GitHub
- URL: https://github.com/bilgenurbekar/turkishcyberbullying
- Owner: BilgeNurBekar
- Created: 2024-08-01T18:08:14.000Z (4 months ago)
- Default Branch: main
- Last Pushed: 2024-08-24T13:49:43.000Z (3 months ago)
- Last Synced: 2024-10-10T08:02:04.055Z (about 1 month ago)
- Topics: bert-fine-tuning, huggingface-transformers, matplotlib, numpy, pandas, python, pytorch, scikit-learn, transformers
- Language: Jupyter Notebook
- Homepage:
- Size: 591 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# TurkishCyberbullying 👩🏼💻👨🏼💻
## İçindekiler
- [Proje Açıklaması](#proje-açıklaması)
- [Kullanılan Modeller](#Modeller)
- [Kurulum](#kurulum)
- [Sonuçlar](#Sonuçlar)
- [Ek](#ek)
- [Katkıda Bulunma](#katkıda-bulunma)## Proje Açıklaması
Bu proje, Türkçe X (eski adıyla twitter) verileri kullanılarak oluşturulan 4 kategorili:
- Nötr
- Kızdırma
- Irkçılık
- Cinsiyetçilikveri seti ile BERT, ConvBERT ve DistilBERT modellerinin fine-tune edilmesini ele alır. Çalışma çok sınıflı metin sınıflandırma projesidir. Çalışmada [nanelimon/turkish-social-media-offensive-dataset](https://huggingface.co/datasets/nanelimon/turkish-social-media-offensive-dataset) veri seti kullanılmıştır.
## Kullanılan Modeller
Çalışmada Wikipedia dökümü, çeşitli OPUS korpusları ve Kemal Oflazer tarafından sağlanan özel bir korpus üzerinde eğitilen [BERTurk](https://huggingface.co/dbmdz/bert-base-turkish-uncased), [ConvBERTurk](https://huggingface.co/dbmdz/convbert-base-turkish-mc4-cased), [DistilBERTurk](https://huggingface.co/dbmdz/distilbert-base-turkish-cased) modelleri kullanılmıştır.
## Kurulum
Bu projeyi yerel ortamınıza kurmak için aşağıdaki adımları izleyin:
### 1. Depoyu klonlayın:
```bash
git clone hhttps://github.com/BilgeNurBekar/TurkishCyberbullying.git
```### 2. Proje dizinine gidin:
```bash
cd TurkishCyberbullying
```### 3. Sanal ortamı oluşturun:
```python
python -m venv ./venv
```### 4. Sanal ortamı etkinleştirin:
- Windows için:
```bash
.\venv\Scripts\activate
```- Unix veya MacOS için:
```bash
source venv/bin/activate
```### 5. Gerekli bağımlılıkları yükleyin:
```python
pip install -r requirements.txt
```## Sonuçlar
### BERTurk
#### Confusion Matrix
![confusionmatrix](./src/bertkarisiklik.png)
#### Precision - Recall Curve (PR Curve)
![PR](./src/bertPR.png)
#### Results Table
![tablo](./src/bertsonuc.png)
### ConvBERTurk
#### Confusion Matrix
![confusionmatrix](./src/convbertkarisiklik.png)
#### Precision - Recall Curve (PR Curve)
![PR](./src/convbertPR.png)
#### Results Table
![tablo](./src/convbertsonuc.png)
### DistilBERTurk
#### Confusion Matrix
![confusionmatrix](./src/distilbertkarışıklık.png)
#### Precision - Recall Curve (PR Curve)
![PR](./src/distilbertPR.png)
#### Results Table
![tablo](./src/distilbertsonuc.png)
## Ek
Çalışmada oluşturulan modelleri kullanmak, eğitmek için [HuggingFace](https://huggingface.co/) platformu üzerinden [AIZinu](https://huggingface.co/AIZinu) profilindeki modelleri inceleyebilirsiniz.
Çalışmanın API' ı için [FASTAPI](https://github.com/BilgeNurBekar/TurkishCyberbullyingFastAPI) reposunu incelemeyi unutmayın ☄️
## Katkıda Bulunma
Katkıda bulunmak isterseniz, lütfen aşağıdaki adımları takip edin:
Depoyu fork edin.
Yeni bir branch oluşturun: git checkout -b feature/ozellik-adi
Değişikliklerinizi yapın ve commit edin.
Pull request açın.
Çalışmayı beğendiyseniz yıldızlamayı unutmayın ⭐️