Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/lexxai/goit_python_ds_hw_06
Модуль 6. Навчання без вчителя. Кластерізація. KMeans. Principal Component Analysis
https://github.com/lexxai/goit_python_ds_hw_06
dbscan-clustering hdbscan-clustering kmeans kmeans-clustering opentsne optics-clustering pca python scikit-learn tsne
Last synced: 7 days ago
JSON representation
Модуль 6. Навчання без вчителя. Кластерізація. KMeans. Principal Component Analysis
- Host: GitHub
- URL: https://github.com/lexxai/goit_python_ds_hw_06
- Owner: lexxai
- License: mit
- Created: 2024-02-05T14:44:38.000Z (12 months ago)
- Default Branch: main
- Last Pushed: 2024-02-09T12:32:02.000Z (12 months ago)
- Last Synced: 2024-11-24T06:13:39.454Z (2 months ago)
- Topics: dbscan-clustering, hdbscan-clustering, kmeans, kmeans-clustering, opentsne, optics-clustering, pca, python, scikit-learn, tsne
- Language: Jupyter Notebook
- Homepage:
- Size: 41.9 MB
- Stars: 0
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Модуль 6. Навчання без вчителя.
*З циклу [домашніх завдань Python Data Science](https://github.com/lexxai/goit_python_data_sciense_homework).*
# Домашнє завдання
Завдання, що пропонуються, необхідно оформити у вигляді одного jupyter ноутбука.
## Завдання 1
У цьому завданні вам потрібно завантажити [ось цей датасет](https://drive.google.com/file/d/1Zvz20Iqeia1eEtFbGa3NcIrt_SNSimP6/view?usp=share_link). Тут ви знайдете 2 файли - з двовимірним датасетом та датасетом `mnist`. Для кожного з них застосуйте алгоритм `K-means` для кластеризації. Щоб знайти оптимальну кількість кластерів, скористайтесь ліктевим методом.## Завдання 2
Візуалізуйте результат роботи кластеризації. Для випадку з `mnist` датасетом, вам потрібно ще скористатись алгоримтом `PCA` щоб зменшити розмірність вашим даних до 2-вимірного варіанту.# Результат
- [goit_python_ds_hw_06.ipynb](goit_python_ds_hw_06.ipynb)
- [Collab goit_python_ds_hw_06.ipynb](https://colab.research.google.com/drive/1SzdJuZXEjNaTOgB4evRvrxaxKQ7QD9WK?usp=sharing)
- [Collab mnist dataset - clustering.ipynb](https://colab.research.google.com/drive/1H4BcH3HgVvLkkLtb7ynjbbNrF56Vq2XX?usp=sharing)## Завдання 1
### Резульат розбитя на кластери зорбражень з бази MNIST
#### 784 ознак, k=19![](cluster_img.jpg)
#### PCA (0.95), 114 ознак, k=13
![](cluster_img_pca.jpg)
## Завдання 2
![](3d-2d-k2.png)
![](3D-MNIST-k19.png)