An open API service indexing awesome lists of open source software.

https://github.com/arfazrll/data-mining-competition

Repository ini berisi partisipasi saya dalam kompetisi ADIKARA 2024 - Data Mining Competition. Repository ini terkait mengembangkan model prediksi Food Price Index menggunakan dataset spatiotemporal.
https://github.com/arfazrll/data-mining-competition

dataanalysis datamining kaggle-competition machine-learning predictive-modeling spatiotemporal-forecasting

Last synced: 6 months ago
JSON representation

Repository ini berisi partisipasi saya dalam kompetisi ADIKARA 2024 - Data Mining Competition. Repository ini terkait mengembangkan model prediksi Food Price Index menggunakan dataset spatiotemporal.

Awesome Lists containing this project

README

          

# ๐ŸŒŸ **ADIKARA 2024 - Data Mining Competition**

![ADIKARA 2024 Banner](https://github.com/Arfazrll/AllReference/blob/main/Adikara.image.header.png?raw=true)

**ADIKARA 2024 - Data Mining Competition**! ๐Ÿ†
Kompetisi ini bertujuan untuk mengasah keterampilan analisis data dalam memprediksi **Food Price Index** dengan dataset spatiotemporal.

---

## ๐Ÿ“‹ **Daftar Isi**

- [๐ŸŒŸ Latar Belakang](#-latar-belakang)
- [๐ŸŽฏ Tujuan](#-tujuan)
- [๐Ÿ“‚ Struktur Repository](#-struktur-repository)
- [๐Ÿ“Š Dataset](#-dataset)
- [๐Ÿ“ Metrik Evaluasi](#-metrik-evaluasi)
- [๐Ÿš€ Alur Penyelesaian](#-alur-penyelesaian)
- [๐Ÿ“˜ Notebook 1 - Pelatihan Model](#-notebook-1---pelatihan-model)
- [๐Ÿ“— Notebook 2 - Prediksi Submission](#-notebook-2---prediksi-submission)
- [๐Ÿ“‘ Format Submission](#-format-submission)
- [๐Ÿ’ป Cara Menjalankan](#-cara-menjalankan)
- [๐Ÿ› ๏ธ Prasyarat](#%EF%B8%8F-prasyarat)
- [๐Ÿ“‚ File Pendukung](#-file-pendukung)
- [๐ŸŒ Teknologi yang Digunakan](#-teknologi-yang-digunakan)
- [๐Ÿ”ฎ Kesimpulan](#-kesimpulan)

---

## ๐ŸŒŸ **Latar Belakang**
Untuk membaca, menganalitis dan menangani data spatiotemporal. Dengan dataset berbasis **indeks harga pangan**, lalu mengembangkan model yang mendukung pengambilan keputusan terkait data tersebut.

---

## ๐ŸŽฏ **Tujuan**
- **Mengaplikasikan Data dan Machine Learning**
- **Meningkatkan teknis dalam data mining**
- **Mendukung pengambilan keputusan berbasis data**

---

## ๐Ÿ“‚ **Struktur Repository**

```plaintext
adikara2024-datamining/
โ”œโ”€โ”€ Notebook File/
โ”‚ โ”œโ”€โ”€ Notebook1_Manusia_Pelupa_ADIKARA2024.ipynb
โ”‚ โ””โ”€โ”€ Notebook2_Manusia_Pelupa_ADIKARA2024.ipynb
โ”œโ”€โ”€ Submission File/
โ”‚ โ”œโ”€โ”€ submission_Manusia Pelupa_ADIKARA2024.csv
โ”‚ โ””โ”€โ”€ test_adikara2024_unlabeled.csv
โ”œโ”€โ”€ adikara2024-datamining/
โ”‚ โ”œโ”€โ”€ train_adikara2024.csv
โ”‚ โ””โ”€โ”€ sample_submission_adikara2024.csv
โ”œโ”€โ”€ LICENSE
โ”œโ”€โ”€ README.md
โ””โ”€โ”€ ...
```

---

## ๐Ÿ“Š **Dataset**

| **File** | **Deskripsi** |
|----------------------------|------------------------------------------------------------|
| `train_adikara2024.csv` | Data pelatihan dengan label *Food Price Index* |
| `test_adikara2024_unlabeled.csv` | Data uji tanpa label, digunakan untuk prediksi |
| `sample_submission_adikara2024.csv` | Contoh format file *submission* untuk leaderboard |

> โš ๏ธ **Catatan:** Pastikan untuk Menggunakan data dengan benar.

---

## ๐Ÿ“ **Metrik Evaluasi**
Menggunakan **Symmetric Mean Absolute Percentage Error (sMAPE)**:

![sMAPE Formula](https://github.com/Arfazrll/AllReference/blob/main/sMape.png)

Semakin **kecil nilai sMAPE**, semakin baik prediksi modelnya.

---

## ๐Ÿš€ **Alur Penyelesaian**

1. ๐Ÿ“ฅ **Eksplorasi Data**
2. ๐Ÿ› ๏ธ **Pre-processing & Feature Engineering**
3. ๐Ÿง  **Pemodelan**
4. ๐Ÿ“Š **Evaluasi Model dengan sMAPE**
5. ๐Ÿ’พ **Eksport Model Terbaik**
6. ๐Ÿ” **Prediksi Data Uji**
7. ๐Ÿ“ **Generate Submission File**

---

## ๐Ÿ“˜ **Notebook 1 - Pelatihan Model**
**Nama File:** `Notebook1_Manusia_Pelupa_ADIKARA2024.ipynb`

Notebook ini mencakup:
- Eksplorasi data (`train_adikara2024.csv`)
- *Pre-processing* (menangani nilai hilang, *encoding*, dsb.)
- Pelatihan model dengan algoritma seperti Random Forest, XGBoost, dll.
- Evaluasi model menggunakan sMAPE
- Eksport model terbaik

---

## ๐Ÿ“— **Notebook 2 - Prediksi Submission**
**Nama File:** `Notebook2_Manusia_Pelupa_ADIKARA2024.ipynb`

Notebook ini mencakup:
- Membaca file `test_adikara2024_unlabeled.csv`
- Mengimpor model terbaik dari Notebook 1
- *Pre-processing* data uji
- Memprediksi *Food Price Index*
- Menghasilkan file submission (`submission_Manusia Pelupa_ADIKARA2024.csv`)

---

## ๐Ÿ“‘ **Format Submission**

Berikut format yang harus digunakan untuk file submission:

```csv
id,FoodPriceIndex
122,20.5
123,21.7
124,19.8
```

---

## ๐Ÿ’ป **Cara Menjalankan**

1. Clone repository ini:
```bash
git clone https://github.com/YourUsername/adikara2024-datamining.git
cd adikara2024-datamining
```

2. Siapkan lingkungan Python (opsional):
```bash
python -m venv env
source env/bin/activate # Untuk Linux/Mac
env\Scripts\activate # Untuk Windows
pip install -r All_Requirements.txt
```

## ๐Ÿ› ๏ธ **Prasyarat**

Pastikan Anda memiliki:
- Python 3.8 atau lebih baru
- Library utama seperti `pandas`, `numpy`, `scikit-learn`, `xgboost`, dll.
- Jupyter Notebook untuk menjalankan `.ipynb` file

---

## ๐Ÿ“‚ **File Pendukung**

| **File/Fungsi** | **Deskripsi** |
|--------------------------|---------------|
| `requirements.txt` | Daftar library yang diperlukan untuk menjalankan kode |
| `sample_submission.csv` | Template untuk format submission |
| `train.csv` | Dataset pelatihan dengan label |
| `test.csv` | Dataset uji tanpa label |

---

## ๐ŸŒ **Teknologi yang Digunakan**

- Python ๐Ÿ
- Jupyter Notebook ๐Ÿ““
- Machine Learning (Random Forest, XGBoost, dll.) ๐Ÿค–
- Pandas & Numpy untuk analisis data ๐Ÿ“Š
- Matplotlib & Seaborn untuk visualisasi ๐Ÿ“ˆ

---

3. Jalankan notebook dengan Jupyter:
```bash
jupyter notebook
```

4. Ikuti instruksi pada `Notebook1` dan `Notebook2` untuk pelatihan serta prediksi.

---

## ๐Ÿ”ฎ **Kesimpulan**

**ADIKARA 2024 - Data Mining Competition** memberikan saya peluang luar biasa untuk meningkatkan kemampuan analisis data spatiotemporal dan machine learning. Dengan memanfaatkan metrik evaluasi seperti sMAPE, saya dapat mengembangkan model prediksi yang akurat dan relevan๐Ÿš€

---