Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/minhnguyends/reportvi-build_user_link-prediction_model_on_meetup_social_network_using_googlecloud
A project has been created by MinhNguyenDS
https://github.com/minhnguyends/reportvi-build_user_link-prediction_model_on_meetup_social_network_using_googlecloud
Last synced: about 1 month ago
JSON representation
A project has been created by MinhNguyenDS
- Host: GitHub
- URL: https://github.com/minhnguyends/reportvi-build_user_link-prediction_model_on_meetup_social_network_using_googlecloud
- Owner: MinhNguyenDS
- Created: 2023-12-04T19:33:47.000Z (about 1 year ago)
- Default Branch: Master
- Last Pushed: 2023-12-04T19:37:58.000Z (about 1 year ago)
- Last Synced: 2024-12-07T07:03:40.130Z (about 1 month ago)
- Language: Jupyter Notebook
- Size: 24 MB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: ReadMe.txt
Awesome Lists containing this project
README
Các phần đã thực hiện trong đề tài:
1. Tìm hiểu công nghệ dữ liệu lớn Google Cloud
- Tổng quan Google Cloud
- Đánh giá ưu nhược điểm
- Cách thức triển khai các thành phần theo kiến trúc dữ liệu lớn
- Cách sử dụng các công cụ để phân tích dữ liệu mạng xã hội bằng Google Cloud2. Xây dựng kiến trúc lưu trữ dữ liệu trên Google Cloud
- Xây dựng và lập lịch cho data pinelines
- Lưu trữ dữ liệu trên data lake: Google Storage
- Lưu trữ dữ liệu trên data warehouse: BigQuery, Neo4J, MongoDB3. Phân tích và xây dựng mô hình gợi ý kết bạn trên mạng xã hội Meetup
- Trích xuất và tiền xử lý dữ liệu từ data warehouse
- Khảo sát và phân tích dữ liệu (EDA)
- Chạy các thuật toán phân tích mạng xã hội
+ Độ đo trung tâm: Degree centrality, Closeness centrality, Betweenness centrality, Eigenvector centrality, Page rank
+ Phát hiện cộng đồng: Louvain
- Mô hình dự đoán liên kết gợi ý kết bạn
+ Dự đoán dựa trên độ tương đồng cục bộ: Jaccard, Adamic-Adar, Preferential Attachment
+ Dự đoán dựa trên độ tương đồng toàn cục: Hitting time, Katz Global
+ Dự đoán dựa trên máy học: Auto-encoder (GCNConv, GraphSAGEConv)