An open API service indexing awesome lists of open source software.

https://github.com/naghim/ik-lab02


https://github.com/naghim/ik-lab02

Last synced: 11 months ago
JSON representation

Awesome Lists containing this project

README

          

# Labor 02

# Pandas

A [pandas]() egy Python programozási nyelvhez írt szoftverkönyvtár adatkezelésre és -elemzésre, nagymértékben megkönnyiti az adatbányászat adattisztítás és adatintegráció lépéseit. Különösen adattáblák és idősorok feldolgozásához szolgáltat megfelelő adatszerkezeteket és műveleteket, táblázatos formában kezeli azokat. A táblázatoknak van fejlécük és indexük. Heterogén adatokat tárolhatunk: szöveges, számadat, igazságérték, dátum stb. Az adatok típusa egy oszlopon belül sem kell, hogy azonos legyen. Remekül együttműködik a Python gépi tanuló könyvtárával ([scikit-learn](https://scikit-learn.org/stable/)) és a legelterjedtebb vizualizációs könyvtárakkal ([matplotlib](https://matplotlib.org/), [seaborn](https://seaborn.pydata.org/)). Neve a "_panel data_" angol kifejezésből származik (egy kifejezés olyan adathalmazokra, amelyek ugyanazon egyedre több időszakra vonatkozó megfigyeléseket tartalmaznak).

Egyéb angol nyelvű anyagok:

- A hivatalos dokumentációhoz tartozó rövid bevezető: http://pandas.pydata.org/pandas-docs/stable/10min.html
- Részletesebb bevezető: https://www.learndatasci.com/tutorials/python-pandas-tutorial-complete-introduction-for-beginners/
- Brandon Rhodes előadása, Pycon 2015: https://www.youtube.com/watch?v=5JnMutdy6Fw

# Feladatok

1. Nyissuk meg a laborhoz tartozó `.ipynb` notebook fájt. Az elméleti áttekintés után oldjuk meg a feladatokat. A laboróra végén ne felejtsük el visszamenteni a szerkesztett jegyzetfüzetet a GitHubra.