https://github.com/guilhermebit/movie-suggestions-using-k-nearest-neighbors
This project implements a movie recommendation system using the K-Nearest Neighbors (KNN) machine learning algorithm.
https://github.com/guilhermebit/movie-suggestions-using-k-nearest-neighbors
algorithms data-science euclidean-distance k-nn machine-learning numpy pandas
Last synced: 2 months ago
JSON representation
This project implements a movie recommendation system using the K-Nearest Neighbors (KNN) machine learning algorithm.
- Host: GitHub
- URL: https://github.com/guilhermebit/movie-suggestions-using-k-nearest-neighbors
- Owner: Guilhermebit
- Created: 2025-02-06T23:06:26.000Z (4 months ago)
- Default Branch: main
- Last Pushed: 2025-02-06T23:07:26.000Z (4 months ago)
- Last Synced: 2025-02-07T00:19:44.240Z (4 months ago)
- Topics: algorithms, data-science, euclidean-distance, k-nn, machine-learning, numpy, pandas
- Language: Jupyter Notebook
- Homepage:
- Size: 146 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
![]()
## Objetivo
Este projeto implementa um sistema de recomendação de filmes utilizando o algoritmo de Machine Learning K-Nearest Neighbors (KNN). A ideia é sugerir filmes para um usuário com base nas avaliações de outros usuários com interesses semelhantes através do cálculo da distância euclidiana.
A análise foi realizada usando o conjunto de dados do [MovieLens](https://grouplens.org/datasets/movielens/latest/) **ml-latest-small.zip**.## Tecnologias
- Python 3.x
- Pandas
- NumPy
- Matplotlib## 🔍 Como funciona o KNN?
O **K-Nearest Neighbors (KNN)** é um algoritmo de aprendizado de máquina baseado em instâncias, usado para classificação e regressão. Ele funciona da seguinte forma:
1. Dado um ponto de entrada, o algoritmo busca os **K vizinhos mais próximos** com base em uma métrica de distância.
2. No caso da recomendação de filmes, esses vizinhos são usuários com preferências semelhantes.
3. Os filmes mais bem avaliados por esses vizinhos são recomendados ao usuário-alvo.No nosso caso, utilizamos a **distância euclidiana** para medir a semelhança entre os usuários.
---
## 📏 O que é a Distância Euclidiana?
A **distância euclidiana** mede o quão longe dois pontos estão em um espaço multidimensional. Ela é definida pela fórmula:
![]()
Onde:
- \( A \) e \( B \) são vetores representando dois usuários.
- \( n \) é o número de filmes avaliados.
- Quanto menor a distância, maior a similaridade entre os usuários.No contexto deste projeto, a distância entre usuários representa o grau de similaridade entre suas preferências. Quanto menor a distância entre um usuário e seus vizinhos mais próximos, mais semelhantes são seus gostos.