https://github.com/tynab/dimension-reduction
CyberSoft Machine Learning 03 - Dimension Reduction
https://github.com/tynab/dimension-reduction
Last synced: 10 months ago
JSON representation
CyberSoft Machine Learning 03 - Dimension Reduction
- Host: GitHub
- URL: https://github.com/tynab/dimension-reduction
- Owner: Tynab
- Created: 2024-02-26T16:58:00.000Z (almost 2 years ago)
- Default Branch: main
- Last Pushed: 2025-01-15T04:08:42.000Z (12 months ago)
- Last Synced: 2025-03-25T19:11:23.331Z (10 months ago)
- Language: Jupyter Notebook
- Homepage:
- Size: 4.52 MB
- Stars: 1
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- Funding: .github/FUNDING.yml
Awesome Lists containing this project
README
# BÀI TẬP
Bài 1:
- TÌm hiểu bộ dataset *load_digits* của sklearn.
- Tiến hành giảm chiều dữ liệu dựa trên phương pháp PCA, phân tích các principle components, tìm các features có vai trò quan trọng trong việc phân lớp digits.
- Áp dụng giảm chiều dữ liệu dựa trên phương pháp LDA, vẽ biểu đồ 2 chiều thể hiện việc phân cụm các digits giữa 2 phương pháp và so sánh kết quả.
Bài 2:
- Áp dụng stemming technique trong clean data *abc_news*.
- Áp dụng LDA huấn luyện ít nhất 100000 dòng để xây dựng topic modeling.
- Trích xuất ra vài topic và thử giải thích chủ đề của chúng, vẽ word cloud cho các topic giải thích.