{"id":24497089,"url":"https://github.com/elifftosunn/textdataclean","last_synced_at":"2026-05-20T06:10:53.082Z","repository":{"id":134511268,"uuid":"573800905","full_name":"elifftosunn/textDataClean","owner":"elifftosunn","description":"Kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılan uygulamadır. ","archived":false,"fork":false,"pushed_at":"2023-03-06T02:25:31.000Z","size":2825,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":2,"default_branch":"master","last_synced_at":"2025-01-21T21:35:24.689Z","etag":null,"topics":["corpus","deasciifier","morphological-analysis","ngram","nltk","numpy","pandas","sentence-embedding","sentence-tokenizer","stemmer","stopwords","string","turkish","turkish-sentence-tokenizer","word-tokenizer"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/elifftosunn.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2022-12-03T13:29:22.000Z","updated_at":"2023-04-08T19:45:42.000Z","dependencies_parsed_at":"2023-06-17T01:45:13.946Z","dependency_job_id":null,"html_url":"https://github.com/elifftosunn/textDataClean","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elifftosunn%2FtextDataClean","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elifftosunn%2FtextDataClean/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elifftosunn%2FtextDataClean/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elifftosunn%2FtextDataClean/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/elifftosunn","download_url":"https://codeload.github.com/elifftosunn/textDataClean/tar.gz/refs/heads/master","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":243693073,"owners_count":20332322,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["corpus","deasciifier","morphological-analysis","ngram","nltk","numpy","pandas","sentence-embedding","sentence-tokenizer","stemmer","stopwords","string","turkish","turkish-sentence-tokenizer","word-tokenizer"],"created_at":"2025-01-21T21:32:08.363Z","updated_at":"2026-05-20T06:10:48.063Z","avatar_url":"https://github.com/elifftosunn.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"# Text Data Cleaning Application\n\nVeri Temizleme aracı herhangi bir formatta(csv, xlsx, json) veriyi yükleyip daha sonra temiz verinin indirilmesi, her kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılmıştır. Veri temizleme aracının üzerinde aynı zamanda NLP aşamları için bilgilendirme ve uygulama kısımları bulunmaktadır.  \n\nText veri temizleme uygulamaları, veri ön işleme aşamasında kullanılan bir tekniktir. Amacı, metin verilerinde yer alan gereksiz ya da istenmeyen karakterleri, kelimeleri ve sembolleri kaldırmak ya da değiştirmektir. Bu işlem, doğru ve güvenilir sonuçlar elde etmek için gereklidir.\n\nMetin verileri, çeşitli kaynaklardan toplanabilir ve bu verilerin temizlenmemiş olması, analiz sürecinde yanlış sonuçlara ve yanıltıcı yorumlara neden olabilir. Metin veri temizleme işlemi, veri içindeki gereksiz karakterleri, sayıları, sembolleri, html etiketlerini, yazım hatalarını, stop-word'leri ve diğer dilbilgisi unsurlarını kaldırarak veri setinin analiz edilebilir hale gelmesini sağlar.\n\nÖzetle, text veri temizleme uygulamaları, doğru sonuçlar elde etmek ve daha güvenilir yorumlar yapmak için önemli bir adımdır. Bu uygulamalar, makine öğrenimi, doğal dil işleme ve diğer veri analizi tekniklerinin başarısını arttırmak için kullanılır.\n\n\n\nhttps://user-images.githubusercontent.com/92747017/205463098-6a15e5f2-c0ca-4239-80fd-d1332e4a8827.mp4\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Felifftosunn%2Ftextdataclean","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Felifftosunn%2Ftextdataclean","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Felifftosunn%2Ftextdataclean/lists"}