Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/MEgooneh/awesome-Iran-datasets

Iranian/Persian Datasets. دیتاست‌های فارسی و ایرانی
https://github.com/MEgooneh/awesome-Iran-datasets

List: awesome-Iran-datasets

awesome data-science datasets machine-learning persian persiandataset

Last synced: 3 months ago
JSON representation

Iranian/Persian Datasets. دیتاست‌های فارسی و ایرانی

Awesome Lists containing this project

README

        

# Awesome Iranian Datasets [![Awesome](https://github.com/MEgooneh/awesome-iran-datasets/blob/master/assets/badge.svg)](https://github.com/MEgooneh/awesome-iran-datasets)

[![Check Links](https://github.com/MEgooneh/awesome-Iran-datasets/actions/workflows/links.yml/badge.svg)](https://github.com/MEgooneh/awesome-Iran-datasets/actions/workflows/links.yml)

A collective list of Iranian/Persian Datasets.

.لیستی گردآوری شده از دادگان(دیتاست)های ایرانی و فارسی

- Categories
- [Persian](#persian)
- [Locations](#locations)
- [Literature](#literature)
- [Health care](#health-care)
- [Social media](#social-media)
- [Governments](#governments)
- [News](#news)
- [Sports](#sport)
- [Articles](#articles)
- [Finance](#finance)
- [Politics](#politics)
- [Environmental](#environmental)
- [Photos](#photos)
- [Movies](#movies)
- [Musics](#musics)
- [Culture](#culture)
- [Contributing](#contributing)

---

## Persian
* [کلمات اسپم پیامک‌ها](https://www.kaggle.com/datasets/amirshnll/persiansmsspamword)
* [کلمات فارسی](https://www.kaggle.com/datasets/amirshnll/persian-words)
* [کلمات بد و نامناسب فارسی](https://www.kaggle.com/amirshnll/persian-swear-words)
* [پیامک‌های فارسی](https://www.kaggle.com/datasets/amirshnll/persian-sms-dataset)
* [نام‌های فارسی به همراه جنسیت(۲۰هزار)](https://github.com/nikahd99/iranian-Names-Database-By-Gender)
* [عبارات دستنویس فارسی](https://github.com/DarjaGFX/IranShahr)
* [وکال فارسی](https://www.kaggle.com/datasets/sabermalek/pcvcspeech)
* [وکال فارسی ۲](https://github.com/shenasa-ai/speech2text#part-of-our-dataset-v01--)
* [تصاویر دستنویس شهرهای ایران به فارسی](https://github.com/mehrdad-moradi/handwritten-city-names-in-Arabic-Persian) - [لینک۲](https://www.kaggle.com/datasets/mehmor/arabicpersian-handwritten-cities-for-postal-apps)
* [دیتاست سوال و پاسخ سوالات تعریفی فارسی](https://www.kaggle.com/datasets/sajjadayobi360/persianqa)
* [دیتاست درخواست و پرسش برای دستیار صوتی](https://www.kaggle.com/datasets/halflingwizard/persian-questions)
* [حروف الفبا با فونت های متفاوت](https://www.kaggle.com/datasets/sabermalek/plf50)
* [دیتابیس وکال/صوتی جملات فارسی](https://www.kaggle.com/datasets/mansourehk/shemo-persian-speech-emotion-detection-database)
* [تیتر استخدامی و مشاغل در ایران](https://www.kaggle.com/datasets/amirshnll/iranian-job-title)

## Locations
* [استان‌ها و شهرهای ایران](https://github.com/kmirzavaziri/iranCitiesDataset)
* [شهرستان های ایران](http://dataheart.ir/article/3888/%D8%AF%DB%8C%D8%AA%D8%A7%D8%B3%D8%AA-%D9%86%D8%A7%D9%85-%D9%87%D8%A7%DB%8C-%D9%85%D8%AD%D9%84-%D8%AF%D8%B1-%D8%B2%D8%A8%D8%A7%D9%86-%D9%81%D8%A7%D8%B1%D8%B3%DB%8C)

## Literature
* [سخن بزرگان فارسی](https://www.kaggle.com/datasets/amirshnll/persian-quotes)
* [لغتنامه معکوس فارسی](https://www.kaggle.com/datasets/malekzadeharman/persian-reverse-dictionary-dataset)
* [کامنت‌ها و نظرات کتاب‌های طاقچه](https://www.kaggle.com/datasets/saeedtqp/taaghche)
* [دیتاست کتاب های فارسی](https://www.kaggle.com/datasets/saeedtqp/persian-books-dataset)
* [دیتاست اشعار نو](https://www.kaggle.com/datasets/elhamaghakhani/persian-poems)
* [ترجمه‌ی فارسی قرآن](https://www.kaggle.com/datasets/zusmani/the-holy-quran?select=Persian.csv)
* [اشعار حافظ](https://www.kaggle.com/datasets/akhorshidi/hafez)
* [اطلاعات کتاب‌های فارسی در دیجیکالا](https://www.kaggle.com/datasets/erfansobhaei/digikala-books)

## Health care
* [پایگاه‌های انتقال خون ایران](https://www.kaggle.com/datasets/amirshnll/ibtodatasets)
* [اخبار خبرگزاری ایسنا درباره‌ی کوید۱۹/کرونا](https://www.kaggle.com/datasets/malekzadeharman/isnacoronanews)
* [تصادفات جاده‌ای](https://www.kaggle.com/datasets/rezanematpour/iran-road-trafficrelated-injuries-and-fatalities)
* [آمار کووید۱۹](https://www.kaggle.com/datasets/atilamadai/covid19)
## Social Media
* [مجموعه توییت‌ها درباره‌ی دربی فوتبال](http://dataheart.ir/article/3654/%D9%85%D8%AC%D9%85%D9%88%D8%B9%D9%87-%D8%AF%D8%A7%D8%AF%D9%87-%D8%AA%D9%88%D8%A6%DB%8C%D8%AA-%D9%87%D8%A7%DB%8C-%D9%81%D8%A7%D8%B1%D8%B3%DB%8C-%D8%AF%D8%B1-%D9%85%D9%88%D8%B1%D8%AF-%D8%AF%D8%B1%D8%A8%DB%8C-%D8%AA%D9%87%D8%B1%D8%A7%D9%86)
* [توییت‌های طرفداران داعش](http://dataheart.ir/article/3390/%D9%85%D8%AC%D9%85%D9%88%D8%B9%D9%87-%D8%AF%D8%A7%D8%AF%D9%87-%D8%AA%D9%88%DB%8C%DB%8C%D8%AA-%D9%87%D8%A7%DB%8C-%D8%B7%D8%B1%D9%81%D8%AF%D8%A7%D8%B1%D8%A7%D9%86-%D8%AF%D8%A7%D8%B9%D8%B4)
* [توییت‌های انگلیسی رئیس‌جمهور روحانی](http://dataheart.ir/article/3369/%D8%AF%DB%8C%D8%AA%D8%A7%D8%B3%D8%AA-(%D9%85%D8%AC%D9%85%D9%88%D8%B9%D9%87-%D8%AF%D8%A7%D8%AF%D9%87)-%D8%AA%D9%85%D8%A7%D9%85%DB%8C-%D8%AA%D9%88%DB%8C%DB%8C%D8%AA-%D9%87%D8%A7%DB%8C-%D8%A7%D9%86%DA%AF%D9%84%DB%8C%D8%B3%DB%8C-%D8%AD%D8%B3%D8%A7%D8%A8-%D8%AF%DA%A9%D8%AA%D8%B1-%D8%B1%D9%88%D8%AD%D8%A7%D9%86%DB%8C)
* [توییت‌های انگلیسی وزیرامورخارجه آقای ظریف](http://dataheart.ir/article/3368/%D8%AF%DB%8C%D8%AA%D8%A7%D8%B3%D8%AA-(%D9%85%D8%AC%D9%85%D9%88%D8%B9%D9%87-%D8%AF%D8%A7%D8%AF%D9%87)-%D8%AA%D9%85%D8%A7%D9%85%DB%8C-%D8%AA%D9%88%DB%8C%DB%8C%D8%AA-%D9%87%D8%A7%DB%8C-%D8%A7%D9%86%DA%AF%D9%84%DB%8C%D8%B3%DB%8C-%D8%AD%D8%B3%D8%A7%D8%A8-%D8%AF%DA%A9%D8%AA%D8%B1-%D8%B8%D8%B1%DB%8C%D9%81)
* [کامنت‌های اینستاگرام پیج نماوا و فیلیمو](https://github.com/socialonet/iran-instagram-dataset)
* [نظرات کالاهای دیجیکالا](https://www.kaggle.com/datasets/soheiltehranipour/digikala-comments-persian-sentiment-analysis)
* [توییت‌های فارسی دسته‌بندی شده بر اساس احساسات](https://www.kaggle.com/datasets/behdadkarimi/persian-tweets-emotional-dataset)
* [چت نوجوان‌ها](https://www.kaggle.com/datasets/rezaali/dataset-for-teenagers-chat-telegram-group-persian)
* [مقالات فارسی در ویرگول](https://www.kaggle.com/datasets/mehranrafiee/persian-articles-for-labeling)
* [توییت‌های اعتراضات ۱۴۰۱](https://www.kaggle.com/datasets/konradb/iran-protests-2022-tweets)
## Governments
* [پایگاه های انتقال خون ایران](https://www.kaggle.com/datasets/amirshnll/ibtodatasets)
* [کدهای شهرستان‌ها](https://github.com/benyaminsalimi/Iranian-national-code-generator)
* [قانون اساسی جمهوری اسلامی ایران](https://github.com/mehdisadeghi/iranconstitution)
* [علائم ترافیکی و راهنمایی‌رانندگی ایران](https://www.kaggle.com/datasets/saraparsaseresht/persian-traffic-sign-dataset-ptsd)

## News
* [اخبار فارسی](https://www.kaggle.com/datasets/amirshnll/persian-news-dataset)
* [اخبار فارسی ۲](https://github.com/skorani/Iran-Knowledge-Graph)
* [اخبار خبرگزاری تسنیم](https://www.kaggle.com/datasets/amirpourmand/tasnimdataset)
* [اخبار بی‌ بی سی فارسی](https://www.kaggle.com/datasets/malekzadeharman/bbc-persian-archive)
* [تصاویر و عکس های خبرگزاری تسنیم](https://www.kaggle.com/datasets/malekzadeharman/persian-image-captioning-dataset)
* [اخبار خبرگزاری ایسنا درباره‌ی کوید۱۹/کرونا](https://www.kaggle.com/datasets/malekzadeharman/isnacoronanews)
* [خبرگزاری فارس سال ۱۳۹۸](https://www.kaggle.com/datasets/amirhossein76/farsnews1398)

## Sports
* [مجموعه توییت ها درباره ی دربی فوتبال](http://dataheart.ir/article/3654/%D9%85%D8%AC%D9%85%D9%88%D8%B9%D9%87-%D8%AF%D8%A7%D8%AF%D9%87-%D8%AA%D9%88%D8%A6%DB%8C%D8%AA-%D9%87%D8%A7%DB%8C-%D9%81%D8%A7%D8%B1%D8%B3%DB%8C-%D8%AF%D8%B1-%D9%85%D9%88%D8%B1%D8%AF-%D8%AF%D8%B1%D8%A8%DB%8C-%D8%AA%D9%87%D8%B1%D8%A7%D9%86)

## Finance
* [بورس تهران](https://www.kaggle.com/datasets/amirshnll/tsetmc-dataset)
* [سهام و بورس](https://github.com/sfmqrb/dataset)
* [قیمت ملک در تهران](https://www.kaggle.com/datasets/peimandaii/house-price-dataset)
* [شاخص بورس ایران](https://www.kaggle.com/datasets/nimapourmoradi/iran-bourse-overal-index)
* [آمار اقتصاد/ جامعه/ زیست‌محیطی ایران (بانک جهانی) - سری زمانی](https://www.kaggle.com/datasets/alireza151/iran-economics-social-and-environmental-timeseries)
* [میزان تولید و مصرف نفت](https://www.kaggle.com/datasets/peimandaii/iranian-oil-production-and-consumption-data)
* [اطلاعات پروازهای داخلی و خارجی ایران سال ۲۰۲۳](https://www.kaggle.com/datasets/mojikab3/iran-inbound-and-outbound-flights-2023)
* [بیش از ۲ میلیون محصول و نظرات از سایت باسلام(۱۴۰۳)](https://www.kaggle.com/datasets/radeai/basalam-comments-and-products)
* [بیش از ۱ میلیون محصول دیجیکالا(۱۴۰۳)](https://www.kaggle.com/datasets/radeai/digikala-comments-and-products)

## Politics
* [آمار روزانه اعتراضات ۱۴۰۱](https://www.kaggle.com/datasets/justin2028/daily-statistics-of-the-2022-iran-protests)

## Environmental
* [زلزله در ایران](https://www.kaggle.com/datasets/mehrdat/irans-earthquakes)
* [میزان بارندگی شهرهای ایران](https://www.kaggle.com/datasets/mohammadrahdanmofrad/average-monthly-precipitation-of-iranian-cities)
* [تحلیل و داده‌های کشاورزی در ایران](https://github.com/BahramJannesar/IranAgricultureDataAnalysis)

## Photos
* [علائم تجاری شرکت‌ها](https://github.com/kargaranamir/Trademarks-from-Iranian-Companies)
* [آگهی‌های دیوار](https://github.com/ebadico/divar-dataset/)
* [آگهی‌های ماشین در سایت دیوار](https://www.kaggle.com/datasets/sinatavakolibanizi/dataset-of-car-category-ads-on-the-divar-site)
* [تصاویر ماشین‌های مرسوم در ایران](https://github.com/SeyedHamidreza/car_plate_dataset)
* [پلاک‌های ماشین ایرانی](https://github.com/alitourani/Iranis-dataset)
* [علائم ترافیکی و راهنمایی‌رانندگی ایران](https://www.kaggle.com/datasets/saraparsaseresht/persian-traffic-sign-dataset-ptsd)
* [تصاویر با توضیحات فارسی](https://www.kaggle.com/datasets/navidkanaani/coco-2017-farsi)
* [تصاویر ماشین‌های ایرانی](https://www.kaggle.com/datasets/usefashrfi/iran-used-cars-dataset)
## Movies
* [لیست فیلم و سریال ایرانی](https://www.kaggle.com/datasets/mohammad26845/persian-movie-dataset-english-persian)
* [لیست فیلم و سریال ایرانی از فیلیمو](https://www.kaggle.com/datasets/arianghasemi/iranian-movies)
## Music
* [لیست آثار فارسی در اسپاتیفای](https://www.kaggle.com/datasets/imuhammad/persian-artists-on-spotfiy)
* [لیست صوتی دستگاه‌های موسیقی سنتی](https://www.kaggle.com/datasets/hosseinmousavi/pcmir-database)
* [پرشنونده ترین آهنگ‌های رادیوجوان](https://www.kaggle.com/datasets/saeedtqp/radiojavan-popular-music-features)

## Culture
* [آمار ازدواج و طلاق](https://www.kaggle.com/datasets/mahdinavaei/marriage-and-divorce-in-iran)

# Contributing

Your contributions are always welcome! Please take a look at the [contribution guidelines](https://github.com/MEgooneh/awesome-iran-datasets/blob/master/CONTRIBUTING.md) first.

از مشارکت شما همواره استقبال می‌شود! لطفا جهت مشارکت به [راهنماء مشارکت](https://github.com/MEgooneh/awesome-iran-datasets/blob/master/CONTRIBUTING.md) نگاه کنید.