https://github.com/elifftosunn/textdataclean
Kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılan uygulamadır.
https://github.com/elifftosunn/textdataclean
corpus deasciifier morphological-analysis ngram nltk numpy pandas sentence-embedding sentence-tokenizer stemmer stopwords string turkish turkish-sentence-tokenizer word-tokenizer
Last synced: 7 months ago
JSON representation
Kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılan uygulamadır.
- Host: GitHub
- URL: https://github.com/elifftosunn/textdataclean
- Owner: elifftosunn
- License: mit
- Created: 2022-12-03T13:29:22.000Z (almost 3 years ago)
- Default Branch: master
- Last Pushed: 2023-03-06T02:25:31.000Z (over 2 years ago)
- Last Synced: 2025-01-21T21:35:24.689Z (9 months ago)
- Topics: corpus, deasciifier, morphological-analysis, ngram, nltk, numpy, pandas, sentence-embedding, sentence-tokenizer, stemmer, stopwords, string, turkish, turkish-sentence-tokenizer, word-tokenizer
- Homepage:
- Size: 2.69 MB
- Stars: 0
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Text Data Cleaning Application
Veri Temizleme aracı herhangi bir formatta(csv, xlsx, json) veriyi yükleyip daha sonra temiz verinin indirilmesi, her kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılmıştır. Veri temizleme aracının üzerinde aynı zamanda NLP aşamları için bilgilendirme ve uygulama kısımları bulunmaktadır.
Text veri temizleme uygulamaları, veri ön işleme aşamasında kullanılan bir tekniktir. Amacı, metin verilerinde yer alan gereksiz ya da istenmeyen karakterleri, kelimeleri ve sembolleri kaldırmak ya da değiştirmektir. Bu işlem, doğru ve güvenilir sonuçlar elde etmek için gereklidir.
Metin verileri, çeşitli kaynaklardan toplanabilir ve bu verilerin temizlenmemiş olması, analiz sürecinde yanlış sonuçlara ve yanıltıcı yorumlara neden olabilir. Metin veri temizleme işlemi, veri içindeki gereksiz karakterleri, sayıları, sembolleri, html etiketlerini, yazım hatalarını, stop-word'leri ve diğer dilbilgisi unsurlarını kaldırarak veri setinin analiz edilebilir hale gelmesini sağlar.
Özetle, text veri temizleme uygulamaları, doğru sonuçlar elde etmek ve daha güvenilir yorumlar yapmak için önemli bir adımdır. Bu uygulamalar, makine öğrenimi, doğal dil işleme ve diğer veri analizi tekniklerinin başarısını arttırmak için kullanılır.
https://user-images.githubusercontent.com/92747017/205463098-6a15e5f2-c0ca-4239-80fd-d1332e4a8827.mp4