https://github.com/mindlessmuse666/eda-explorer
Инструмент на Python для разведочного анализа данных (EDA) и визуализации, поддерживающий загрузку данных CSV и JSON, с модульной архитектурой ООП. Практическая работа по теме: "Обнаружение и визуализация данных для понимания их сущности" дисциплины "МДК 13.01: Основы применения методов искусственного интеллекта в программировании".
https://github.com/mindlessmuse666/eda-explorer
csv-visualization data-analysis data-science data-visualization exploratory-data-analysis json-visualization matplotlib oop pandas python seaborn
Last synced: 6 months ago
JSON representation
Инструмент на Python для разведочного анализа данных (EDA) и визуализации, поддерживающий загрузку данных CSV и JSON, с модульной архитектурой ООП. Практическая работа по теме: "Обнаружение и визуализация данных для понимания их сущности" дисциплины "МДК 13.01: Основы применения методов искусственного интеллекта в программировании".
- Host: GitHub
- URL: https://github.com/mindlessmuse666/eda-explorer
- Owner: MindlessMuse666
- License: mit
- Created: 2025-01-19T16:40:46.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2025-01-19T20:05:20.000Z (about 1 year ago)
- Last Synced: 2025-03-22T18:18:54.199Z (11 months ago)
- Topics: csv-visualization, data-analysis, data-science, data-visualization, exploratory-data-analysis, json-visualization, matplotlib, oop, pandas, python, seaborn
- Language: Python
- Homepage:
- Size: 10.7 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Исследование EDA (EDA Explorer) 
Этот проект представляет собой инструмент на Python для **разведочного анализа данных (EDA)** и **визуализации**. Он разработан с целью предоставить модульное и расширяемое решение для исследования наборов данных, следуя принципам ООП. Этот проект является практической работой.
- **Тема практической работы:** `Обнаружение и визуализация данных для понимания их сущности`
- **Дисциплина:** `МДК 13.01: Основы применения методов искусственного интеллекта в программировании`
## Возможности
- **Загрузка данных:** Поддерживает загрузку данных как из **CSV, так и из JSON** файлов, как из локальных путей, так и по URL.
- **Анализ данных:** Выполняет основные операции EDA, включая:
- Проверку на наличие пропущенных значений.
- Расчет описательных статистик для числовых данных.
- Вычисление корреляционных матриц для понимания взаимосвязей между переменными.
- **Визуализация данных:** Создает наглядные визуализации, такие как:
- Гистограммы для отображения распределений отдельных переменных.
- Тепловые карты для визуализации корреляционных матриц.
- **Модульность и расширяемость:** Реализован с акцентом на модульность, используя принципы ООП для упрощения сопровождения и расширения.
- **Обработка ошибок:** Включена надежная обработка ошибок для корректного управления различными сценариями, включая некорректные форматы файлов, отсутствующие данные и проблемы с сетью.
## Скриншоты работы
### [main.py](main.py)

### Корреляционная матрица

### График распределения чаевых

### График распределения общей суммы счёта

## Используемые технологии
- `Python`
- `Pandas`
- `Seaborn`
- `Matplotlib`
- `Requests`
## Структура проекта
### Дерево проекта
```
eda-explorer/
├── abstractions/
│ └── abstract_data_loader.py
├── analysis/
│ ├── data_analyser.py
│ └── tips_data_analyzer.py
├── loaders/
│ ├── csv_data_loader.py
│ └── json_data_loader.py
├── visualization/
│ └── data_visualizer.py
├── __init__.py
├── .gitignore
├── LICENSE
├── main.py
├── README.md
└── requirements.txt
```
### Главные скрипты проекта
- [__init__.py](__init__.py): Делает eda-explorer пакетом Python.
- [abstract_data_loader.py](abstractions/abstract_data_loader.py): Определяет абстрактный класс DataLoader и конкретные классы для загрузки данных (CSVDataLoader, JSONDataLoader).
- [data_analyzer.py](analysis\data_analyzer.py): Определяет класс DataAnalyzer для выполнения операций EDA.
- [tips_data_analyzer.py](analysis/tips_data_analyzer.py): Определяет класс TipsDataAnalyzer для координации процесса анализа и визуализации данных, конкретно для данных о чаевых.
- [data_visualizer.py](visualization\data_visualizer.py): Определяет класс DataVisualizer для создания визуализаций.
- [main.py](main.py): Основной скрипт для запуска анализа и визуализации.
## Начало работы
1. Склонируйте репозиторий:
```bash
git clone https://github.com/MindlessMuse666/eda-explorer
```
2. Перейдите в директорию проекта:
```bash
cd eda-explorer
```
3. Установите необходимые пакеты с помощью [requirements.txt](requirements.txt):
```bash
pip install -r requirements.txt
```
4. Запустите основной скрипт:
```bash
python main.py
```
## Вклад
Приветствуются любые вклады! Не стесняйтесь открывать **issues** или отправлять **pull requests**.
## Лицензия
Этот проект распространяется под лицензией MIT - смотрите файл [LICENSE](LICENSE) для деталей.
## Автор
Бедин Владислав ([MindlessMuse666](https://github.com/MindlessMuse666))
- GitHub: [MindlessMuse666](https://github.com/MindlessMuse666 "Владислав: https://github.com/MindlessMuse666")
- Telegram: [@mindless_muse](t.me/mindless_muse)
- Gmail: [mindlessmuse.666@gmail.com](mindlessmuse.666@gmail.com)