https://github.com/rezaafaisal/imbd-review-pipeline

First submission Dicoding Machine Learning operations on reviewing IMBD comments using Tensorflow Extended
https://github.com/rezaafaisal/imbd-review-pipeline

tensorflow-extended

Last synced: 3 months ago
JSON representation

First submission Dicoding Machine Learning operations on reviewing IMBD comments using Tensorflow Extended

Host: GitHub
URL: https://github.com/rezaafaisal/imbd-review-pipeline
Owner: rezaafaisal
Created: 2024-12-22T03:07:09.000Z (5 months ago)
Default Branch: main
Last Pushed: 2024-12-22T03:11:06.000Z (5 months ago)
Last Synced: 2025-02-17T05:33:10.821Z (3 months ago)
Topics: tensorflow-extended
Language: Jupyter Notebook
Homepage:
Size: 13.2 MB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# Submission 1: Troll Binary Classification
Nama: Reza Faisal

Username dicoding: rezaafaisal

| | Deskripsi |
| ----------- | ----------- |
| Dataset | [IMDB Movie Reviews (Binary Sentiment)](https://www.kaggle.com/datasets/thedevastator/imdb-large-movie-review-dataset-binary-sentiment) |
| Masalah | Dalam dunia hiburan khususnya film terkadang kita melihat cuplikan yang membuat kita menjadi sentimen dalam menilai film tersebut meski belum menonton film itu secara full, projek ini memudahkan orang dalam menilai apakah film tersebut baik atau tidak berdasarkan sentimen komentar orang-orang yang telah menontonnya |
| Solusi machine learning | Maka dari itu dibutuhkan sebuah sistem machine learning yang dapat mendeteksi kalimat memiliki makna negatif ataupun positif |
| Metode pengolahan | Metode pengolahan data yang digunakan pada proyek ini berupa tokenisasi fitur input (text dari sebuah kalimat) yang awalnya berupa text diubah menjadi susunan angka yang merepresentasikan text tersebut agar dapat dengan mudah dimengerti oleh model |
| Arsitektur model | Model yang dibangun menggunakan layer TextVectorization sebagai layer yang akan memproses input string kedalam bentuk susunan angka, kemudian layer Embedding yang bertugas untuk mempelajari kedekatan atau kemiripan dari sebuah kata yang berguna untuk mengetahui apakah kata tersebut merupakan kata negatif atau kata positif. Lalu terdapat 2 hidden layer dan 1 output layer. |
| Metrik evaluasi | Metric yang digunakan pada model yaitu BinaryAccuracy, TruePositive, FalsePositive, TrueNegative, FalseNegative untuk mengevaluasi performa model dalam menentukan klasifikasi|
| Performa model | Model yang dibuat menghasilkan performa yang cukup baik dalam memberikan prediksi untuk text berita yang diinputkan, dan dari pelatihan yang dilakukan model menghasilkan binary_accuracy dan val_binary_accuracy di sekitar 86.76% |

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/rezaafaisal/imbd-review-pipeline

Awesome Lists containing this project

README