https://github.com/rezaafaisal/imbd-review-pipeline
First submission Dicoding Machine Learning operations on reviewing IMBD comments using Tensorflow Extended
https://github.com/rezaafaisal/imbd-review-pipeline
tensorflow-extended
Last synced: 3 months ago
JSON representation
First submission Dicoding Machine Learning operations on reviewing IMBD comments using Tensorflow Extended
- Host: GitHub
- URL: https://github.com/rezaafaisal/imbd-review-pipeline
- Owner: rezaafaisal
- Created: 2024-12-22T03:07:09.000Z (5 months ago)
- Default Branch: main
- Last Pushed: 2024-12-22T03:11:06.000Z (5 months ago)
- Last Synced: 2025-02-17T05:33:10.821Z (3 months ago)
- Topics: tensorflow-extended
- Language: Jupyter Notebook
- Homepage:
- Size: 13.2 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Submission 1: Troll Binary Classification
Nama: Reza FaisalUsername dicoding: rezaafaisal
| | Deskripsi |
| ----------- | ----------- |
| Dataset | [IMDB Movie Reviews (Binary Sentiment)](https://www.kaggle.com/datasets/thedevastator/imdb-large-movie-review-dataset-binary-sentiment) |
| Masalah | Dalam dunia hiburan khususnya film terkadang kita melihat cuplikan yang membuat kita menjadi sentimen dalam menilai film tersebut meski belum menonton film itu secara full, projek ini memudahkan orang dalam menilai apakah film tersebut baik atau tidak berdasarkan sentimen komentar orang-orang yang telah menontonnya |
| Solusi machine learning | Maka dari itu dibutuhkan sebuah sistem machine learning yang dapat mendeteksi kalimat memiliki makna negatif ataupun positif |
| Metode pengolahan | Metode pengolahan data yang digunakan pada proyek ini berupa tokenisasi fitur input (text dari sebuah kalimat) yang awalnya berupa text diubah menjadi susunan angka yang merepresentasikan text tersebut agar dapat dengan mudah dimengerti oleh model |
| Arsitektur model | Model yang dibangun menggunakan layer TextVectorization sebagai layer yang akan memproses input string kedalam bentuk susunan angka, kemudian layer Embedding yang bertugas untuk mempelajari kedekatan atau kemiripan dari sebuah kata yang berguna untuk mengetahui apakah kata tersebut merupakan kata negatif atau kata positif. Lalu terdapat 2 hidden layer dan 1 output layer. |
| Metrik evaluasi | Metric yang digunakan pada model yaitu BinaryAccuracy, TruePositive, FalsePositive, TrueNegative, FalseNegative untuk mengevaluasi performa model dalam menentukan klasifikasi|
| Performa model | Model yang dibuat menghasilkan performa yang cukup baik dalam memberikan prediksi untuk text berita yang diinputkan, dan dari pelatihan yang dilakukan model menghasilkan binary_accuracy dan val_binary_accuracy di sekitar 86.76% |