An open API service indexing awesome lists of open source software.

https://github.com/tynab/dimension-reduction

CyberSoft Machine Learning 03 - Dimension Reduction
https://github.com/tynab/dimension-reduction

Last synced: 10 months ago
JSON representation

CyberSoft Machine Learning 03 - Dimension Reduction

Awesome Lists containing this project

README

          

# BÀI TẬP
Bài 1:
- TÌm hiểu bộ dataset *load_digits* của sklearn.
- Tiến hành giảm chiều dữ liệu dựa trên phương pháp PCA, phân tích các principle components, tìm các features có vai trò quan trọng trong việc phân lớp digits.
- Áp dụng giảm chiều dữ liệu dựa trên phương pháp LDA, vẽ biểu đồ 2 chiều thể hiện việc phân cụm các digits giữa 2 phương pháp và so sánh kết quả.

Bài 2:
- Áp dụng stemming technique trong clean data *abc_news*.
- Áp dụng LDA huấn luyện ít nhất 100000 dòng để xây dựng topic modeling.
- Trích xuất ra vài topic và thử giải thích chủ đề của chúng, vẽ word cloud cho các topic giải thích.