An open API service indexing awesome lists of open source software.

https://github.com/acetinkaya/tf-idf-and-cosine-similarity-based-content-recommendation-system-for-netflix-data

A Content Recommendation System Application with TF-IDF Algorithm and Cosine Similarity on Netflix Data //
https://github.com/acetinkaya/tf-idf-and-cosine-similarity-based-content-recommendation-system-for-netflix-data

artificial-intelligence cosine-similarity natural-language-processing tf-idf-algorithm

Last synced: 8 months ago
JSON representation

A Content Recommendation System Application with TF-IDF Algorithm and Cosine Similarity on Netflix Data //

Awesome Lists containing this project

README

          

## TF-IDF-and-Cosine-Similarity-Based-Content-Recommendation-System-for-Netflix-Data

Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması

A Content Recommendation System Application with TF-IDF Algorithm and Cosine Similarity on Netflix Data

---

## Authors
- **Özlem Gelemet**
Department of Computer Engineering, Faculty of Engineering and Architecture, Istanbul Gelisim University, Istanbul, Turkey

- **Hakan Aydın**
Department of Computer Engineering, Faculty of Engineering, Istanbul Topkapı University, Istanbul, Turkey

- [**Ali Çetinkaya**](https://scholar.google.com.tr/citations?user=XSEW-NcAAAAJ)
Department of Electronics Technology, Istanbul Gelisim Vocational School, Istanbul Gelisim University, Istanbul, Turkey

*For Correspondence: alcetinkaya@gelisim.edu.tr*

## Article Information
- **Received**: November 10, 2021
- **Accepted**: January 29, 2022
- **DOI:** 10.5824/ajite.2022.01.002.x
- **Full Article Access Link**: [Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması](https://dergipark.org.tr/tr/pub/ajit-e/issue/68716/1012354) // [A Content Recommendation System Application with TF-IDF Algorithm and Cosine Similarity on Netflix Data](https://dergipark.org.tr/tr/pub/ajit-e/issue/68716/1012354)

---

Özet:

Günümüzde kullanıcılar dijital platformlarda kullanılan çevrimiçi içerik sitelerinde bulunan içeriklerde arama yapmak, bulmak ve bunları zaman ve mekan bağımsız olarak tüketmek istemektedirler. İnternet üzerinden yayın yapan bu platformlar arasında dünya çapında en yaygın olanlardan birisi de Netflix’tir. Bu çalışmanın amacı TF-IDF (term frequency–inverse document frequency) algoritması ve Kosinüs benzerliği ile Doğal Dil İşleme (NLP) ile Netflix kullanıcı verileri üzerinde bir içerik öneri sistemi uygulaması geliştirmektir. Bu bağlamda çalışmamızda yapılan analizler ile benzerlik yöntemleri ve uygun eşleşme verilerinin bulunması, böylelikle kullanıcılara kişisel bazda öneri yapılması hedeflenmiştir. Çalışma kapsamında hem Türkçe ve hem de diğer dillerdeki filmler ve diziler üzerinde farklı deneyler yapılmıştır. Yapılan deneyler neticesinde kosinüs benzerliği kullanılarak en yüksek benzerlik başarısı %91, en düşük benzerlik başarısı ise %43 olarak elde edilmiştir. Deneyler aynı veriler üzerinde TF-IDF algoritması ile yapıldığında ise başarı oranı %99 ile %80 arasında elde edilmiştir. Çalışma sonuçları, TF-IDF algoritması ile yapılan deneylerde, kosinüs benzerliği kullanılarak yapılan deneylere nazaran daha yüksek başarı oranının elde edildiğini ortaya koymaktadır. Çalışmamızın benzerlik yöntemleri ve uygun eşleşme verileri kullanılarak kişisel bazda öneri yapmayı hedefleyen içerik tabanlı öneri sistemi uygulamalarının geliştirilmesi bağlamında literatüre katkı sağlayacağı değerlendirilmektedir.

Anahtar Kelimeler: Doğal Dil İşleme, TF-IDF, İçerik Öneri Sistemi, Netflix

Abstract:

Today, users want to search, find and consume content on online content sites used on digital platforms, regardless of time and place. Among these platforms that broadcast over the internet, one of the most common worldwide is Netflix. The purpose of this study is to develop a content recommendation system application on Netflix user data with TF-IDF (term frequency–inverse document frequency) algorithm and Natural Language Processing (NLP) with Cosine similarity. In this context, it is aimed to find similarity methods and suitable matching data with the analyzes made in our study, thus making suggestions to the users on a personal basis. Within the scope of the study, different experiments were carried out on films and TV series in both Turkish and other languages. As a result of the experiments, using cosine similarity, the highest similarity success was 91% and the lowest similarity success was 43%. When the experiments were performed with the TF-IDF algorithm on the same data, the success rate was between 99% and 80%. The results of the study reveal that a higher success rate is obtained in the experiments performed with the TF-IDF algorithm compared to the experiments using cosine similarity. It is considered that our study will contribute to the literature in the context of developing content-based recommendation system applications that aim to make suggestions on a personal basis using similarity methods and appropriate matching data.

Keywords: Natural Language Processing, TF-IDF, Content Recommendation System, Netflix

## How to Cite

- **IEEE**: Ö. Gelemet, H. Aydin, and A. Çeti̇nkaya, “Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması,” AJIT-e Academic Journal of Information Technology, vol. 13, no. 48, pp. 31–52, Feb. 2022, doi: 10.5824/ajite.2022.01.002.x.

- **APA**: Gelemet, Ö., Aydın, H., & Çetinkaya, A. (2022). Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması. AJIT-E: Academic Journal of Information Technology, 13(48), 31-52. https://doi.org/10.5824/ajite.2022.01.002.x

- **MLA**: Gelemet, Özlem, Hakan Aydın, and Ali Çetinkaya. "Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması." AJIT-e: Academic Journal of Information Technology 13.48 (2022): 31-52., 2022, doi: 10.5824/ajite.2022.01.002.x.

## License

This work is licensed under a [Creative Commons Attribution-Non Commercial 4.0 International License](https://creativecommons.org/licenses/by-nc/4.0/), allowing non-commercial sharing and adaptation with proper attribution.
Çalışma yayınlandığı dergideki makaleler Creative Commons Atıf-AynıLisanslaPaylaş 4.0 Uluslararası Lisansı ile lisanslanmıştır.

![alternatif metin](https://github.com/acetinkaya/TF-IDF-and-Cosine-Similarity-Based-Content-Recommendation-System-for-Netflix-Data/blob/main/Netflix-TF-IDF.png)