Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/lexxai/goit_python_ds_hw_06

Модуль 6. Навчання без вчителя.  Кластерізація. KMeans. Principal Component Analysis
https://github.com/lexxai/goit_python_ds_hw_06

dbscan-clustering hdbscan-clustering kmeans kmeans-clustering opentsne optics-clustering pca python scikit-learn tsne

Last synced: 7 days ago
JSON representation

Модуль 6. Навчання без вчителя.  Кластерізація. KMeans. Principal Component Analysis

Awesome Lists containing this project

README

        

# Модуль 6. Навчання без вчителя.

*З циклу [домашніх завдань Python Data Science](https://github.com/lexxai/goit_python_data_sciense_homework).*

# Домашнє завдання

Завдання, що пропонуються, необхідно оформити у вигляді одного jupyter ноутбука.
## Завдання 1
У цьому завданні вам потрібно завантажити [ось цей датасет](https://drive.google.com/file/d/1Zvz20Iqeia1eEtFbGa3NcIrt_SNSimP6/view?usp=share_link). Тут ви знайдете 2 файли - з двовимірним датасетом та датасетом `mnist`. Для кожного з них застосуйте алгоритм `K-means` для кластеризації. Щоб знайти оптимальну кількість кластерів, скористайтесь ліктевим методом.

## Завдання 2
Візуалізуйте результат роботи кластеризації. Для випадку з `mnist` датасетом, вам потрібно ще скористатись алгоримтом `PCA` щоб зменшити розмірність вашим даних до 2-вимірного варіанту.

# Результат

- [goit_python_ds_hw_06.ipynb](goit_python_ds_hw_06.ipynb)
- [Collab goit_python_ds_hw_06.ipynb](https://colab.research.google.com/drive/1SzdJuZXEjNaTOgB4evRvrxaxKQ7QD9WK?usp=sharing)
- [Collab mnist dataset - clustering.ipynb](https://colab.research.google.com/drive/1H4BcH3HgVvLkkLtb7ynjbbNrF56Vq2XX?usp=sharing)

## Завдання 1

### Резульат розбитя на кластери зорбражень з бази MNIST
#### 784 ознак, k=19

![](cluster_img.jpg)

#### PCA (0.95), 114 ознак, k=13

![](cluster_img_pca.jpg)

## Завдання 2
![](3d-2d-k2.png)
![](3D-MNIST-k19.png)