https://github.com/naghim/ik-lab06
https://github.com/naghim/ik-lab06
Last synced: 10 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/naghim/ik-lab06
- Owner: naghim
- Created: 2025-03-24T09:09:22.000Z (10 months ago)
- Default Branch: main
- Last Pushed: 2025-03-24T09:20:55.000Z (10 months ago)
- Last Synced: 2025-03-24T10:29:37.830Z (10 months ago)
- Language: Jupyter Notebook
- Size: 3.91 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Labor 06
# Gyakori elemhalmazok előállítása (FP-Growth algoritmus)
## FP-Growth algoritmus
Ebben a laborban a FP-Growth algoritmust vizsgáljuk meg, amely hatékonyabb megoldást kínál a gyakori elemhalmazok kinyerésére, mint az Apriori algoritmus. Az FP-Growth a Frequent Pattern Tree (FP-Tree) adatszerkezetet használja, amely lehetővé teszi, hogy elkerüljük a nagyszámú kandidátushalmaz előállítását, ezzel javítva a számítási teljesítményt, különösen nagy adatbázisok esetén.
Az FP-Growth algoritmus két fő lépésből áll:
1. FP-Tree (Frequent Pattern Tree) felépítése
2. Rekurzív gyakori elemhalmaz keresés az FP-Tree-ben
Az FP-Tree egy kompakt, fa alapú adatszerkezet, amely az input tranzakciós adatokat hatékonyan tárolja. Ahelyett, hogy a teljes tranzakciós halmazt több lépésben újraszámolná (mint az Apriori), az FP-Tree csoportosítja az azonos prefixeket egy tömörített szerkezetbe.
---
A labor során az FP-Growth algoritmus Python implementációját próbáljuk ki, és összehasonlítjuk a teljesítményét más algoritmusokkal, például az Apriori módszerrel.
# Feladatok
1. Nyissuk meg a laborhoz tartozó Jupyter Notebook (`.ipynb`) fájlt. Ismerkedjünk meg az FP-Growth algoritmus működésével és annak implementációjával.
2. Futtassuk a notebookban található kódokat, és elemezzük az eredményeket.
3. Hasonlítsuk össze az FP-Growth és az Apriori algoritmus futási idejét és hatékonyságát különböző adathalmazokon.
A laboróra végén mentsük el a módosított jegyzetfüzetet, és töltsük fel a GitHubra.