https://github.com/lintangwisesa/ujian_machinelearning_jcds03
Panduan Soal Ujian Machine Learning Job Connector Data Science batch 3
https://github.com/lintangwisesa/ujian_machinelearning_jcds03
exam
Last synced: 7 months ago
JSON representation
Panduan Soal Ujian Machine Learning Job Connector Data Science batch 3
- Host: GitHub
- URL: https://github.com/lintangwisesa/ujian_machinelearning_jcds03
- Owner: LintangWisesa
- Created: 2019-03-22T01:41:39.000Z (over 6 years ago)
- Default Branch: master
- Last Pushed: 2019-03-22T06:03:18.000Z (over 6 years ago)
- Last Synced: 2025-01-08T14:16:55.991Z (9 months ago)
- Topics: exam
- Size: 176 KB
- Stars: 4
- Watchers: 2
- Forks: 2
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Machine Learning Exam

#
### **Soal 1 - Jumlah Penduduk Indonesia**
Disediakan __1 buah dataset (file Excel)__ hasil sensus BPS (Badan Pusat Statistik) tentang jumlah penduduk Indonesia berdasarkan provinsi pada tahun 1971, 1980, 1990, 1995, 2000 & 2010. Unduh dataset via BPS: [unduh di sini](https://www.bps.go.id/statictable/2009/02/20/1267/penduduk-indonesia-menurut-provinsi-1971-1980-1990-1995-2000-dan-2010.html). __Dilarang keras untuk menyunting/mengubah konten dataset!__ Kemudian dengan memanfaatkan dataset tersebut, selesaikanlah soal-soal berikut:
1. Buatlah sebuah file python (__*soal1_1.py*__) yang dapat menampilkan grafik: *(1)* jumlah penduduk __Indonesia__, *(2)* jumlah penduduk dari provinsi yang memiliki __*penduduk terbanyak di tahun 2010*__, dan *(3)* jumlah penduduk dari provinsi yang memiliki __*penduduk paling sedikit di tahun 1971*__!
Provinsi dengan jumlah penduduk terbanyak di tahun 2010 adalah __Jawa Barat__, dan provinsi dengan jumlah penduduk paling sedikit di tahun 1971 adalah __Bengkulu__. Namun Anda __dilarang__ untuk menuliskan kata _"Jawa Barat"_, _"Bengkulu"_ dan _"Indonesia"_ di dalam script python Anda. Hasil yang diharapkan kurang lebih ditunjukkan oleh grafik berikut:

2. Buatlah sebuah file python (__*soal1_2.py*__) yang dapat melakukan __regresi linear__ terhadap hasil di soal sebelumnya, untuk memprediksi jumlah penduduk di masa mendatang. _(1)_ Gambarkan _best fit line_ (garis terbaik) hasil regresi pada grafik, dan _(2)_ prediksikan berapa jumlah penduduk Indonesia, Jawa Barat & Bengkulu pada tahun 2050!
Anda __dilarang__ untuk menuliskan kata _"Jawa Barat"_, _"Bengkulu"_ dan _"Indonesia"_ di dalam script python Anda. Hasil yang diharapkan kurang lebih ditunjukkan oleh gambar berikut:

Dan di terminal akan muncul hasil prediksi:
```bash
Prediksi jumlah penduduk Jawa Barat di tahun 2050: 65443585
Prediksi jumlah penduduk Bengkulu di tahun 2050: 3139135
Prediksi jumlah penduduk INDONESIA di tahun 2050: 359273669
```_**Catatan:**_ _Commit & push source code jawaban soal ini (beserta screenshot grafik) ke __Github__ Anda, buatlah repo dengan nama __Ujian_Penduduk_Indonesia__. Kemudian lampirkan __url link repo Github__ Anda via email ke lintang@purwadhika.com!_
#
### **Soal 2 - Pemain Bola Muda Berbakat**
Anda adalah seorang manager klub sepakbola ternama, yang ingin merekrut pemain sepakbola muda berbakat. Pemain yang anda targetkan memiliki kriteria sebagai berikut:
- usia (__Age__) __<= 25__ tahun,
- skill umum (__Overall__) __>= 80__ point, dan
- potensi (__Potential__) __>= 80__.Tersedia __1 buah dataset (file csv)__ yang memuat daftar lengkap pemain sepakbola profesional kelas dunia. Unduh dataset via kaggle: [unduh di sini](https://www.kaggle.com/karangadiya/fifa19). __Dilarang keras untuk menyunting/mengubah konten dataset!__ Kemudian dengan memanfaatkan dataset tersebut, selesaikanlah soal-soal berikut:
1. Buatlah sebuah file python (__*soal2_1.py*__) yang dapat menampilkan 2 buah grafik dalam 1 figure: *(1)* grafik kaitan antara usia (__Age__) vs skill umum (__Overall__) dan *(2)* grafik kaitan antara usia (__Age__) vs potensi (__Potential__). Hasil yang diharapkan kurang lebih ditunjukkan oleh gambar di bawah. Titik hijau adalah daftar pemain target yang ingin Anda rekrut.

2. Buatlah sebuah file python (__*soal2_2.py*__) yang berisi algoritma machine learning yang dapat melakukan pengelompokkan pemain: target & non-target. Gunakan minimal __3 algoritma__, lalu bandingkan dengan metode __k-fold cross validation__ & tentukan mana algoritma yang memiliki akurasi terbaik.
3. Buatlah sebuah file python (__*soal2_3.py*__) yang menggunakan algoritma terbaik di soal sebelumnya, untuk memprediksi/mengelompokkan data pemain berikut apakah tergolong pemain target yang ingin kita rekrut atau tidak:
Name | Age | Overall | Potential
-|-|-|-
Andik Vermansyah | 27 | 87 | 90
Awan Setho Raharjo | 22 | 75 | 83
Bambang Pamungkas | 38 | 85 | 75
Cristian Gonzales | 43 | 90 | 85
Egy Maulana Vikri | 18 | 88 | 90
Evan Dimas | 24 | 85 | 87
Febri Hariyadi | 23 | 77 | 80
Hansamu Yama Pranata | 24 | 82 | 85
Septian David Maulana | 22 | 83 | 80
Stefano Lilipaly | 29 | 88 | 86_**Catatan:**_ _Commit & push source code jawaban soal ini (beserta screenshot grafik) ke __Github__ Anda, buatlah repo dengan nama __Ujian_Pemain_Muda_Berbakat__. Kemudian lampirkan __url link repo Github__ Anda via email ke lintang@purwadhika.com!_
#
### *__#HappyCoding__* :relaxed:
#### Lintang Wisesa :love_letter: _lintangwisesa@ymail.com_
[Facebook](https://www.facebook.com/lintangbagus) |
[Twitter](https://twitter.com/Lintang_Wisesa) |
[Google+](https://plus.google.com/u/0/+LintangWisesa1) |
[Youtube](https://www.youtube.com/user/lintangbagus) |
:octocat: [GitHub](https://github.com/LintangWisesa) |
[Hackster](https://www.hackster.io/lintangwisesa)