An open API service indexing awesome lists of open source software.

https://github.com/elifftosunn/textdataclean

Kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılan uygulamadır.
https://github.com/elifftosunn/textdataclean

corpus deasciifier morphological-analysis ngram nltk numpy pandas sentence-embedding sentence-tokenizer stemmer stopwords string turkish turkish-sentence-tokenizer word-tokenizer

Last synced: 7 months ago
JSON representation

Kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılan uygulamadır.

Awesome Lists containing this project

README

          

# Text Data Cleaning Application

Veri Temizleme aracı herhangi bir formatta(csv, xlsx, json) veriyi yükleyip daha sonra temiz verinin indirilmesi, her kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılmıştır. Veri temizleme aracının üzerinde aynı zamanda NLP aşamları için bilgilendirme ve uygulama kısımları bulunmaktadır.

Text veri temizleme uygulamaları, veri ön işleme aşamasında kullanılan bir tekniktir. Amacı, metin verilerinde yer alan gereksiz ya da istenmeyen karakterleri, kelimeleri ve sembolleri kaldırmak ya da değiştirmektir. Bu işlem, doğru ve güvenilir sonuçlar elde etmek için gereklidir.

Metin verileri, çeşitli kaynaklardan toplanabilir ve bu verilerin temizlenmemiş olması, analiz sürecinde yanlış sonuçlara ve yanıltıcı yorumlara neden olabilir. Metin veri temizleme işlemi, veri içindeki gereksiz karakterleri, sayıları, sembolleri, html etiketlerini, yazım hatalarını, stop-word'leri ve diğer dilbilgisi unsurlarını kaldırarak veri setinin analiz edilebilir hale gelmesini sağlar.

Özetle, text veri temizleme uygulamaları, doğru sonuçlar elde etmek ve daha güvenilir yorumlar yapmak için önemli bir adımdır. Bu uygulamalar, makine öğrenimi, doğal dil işleme ve diğer veri analizi tekniklerinin başarısını arttırmak için kullanılır.

https://user-images.githubusercontent.com/92747017/205463098-6a15e5f2-c0ca-4239-80fd-d1332e4a8827.mp4