https://github.com/rickyarians/scrappy-do
Projek ini dikembangkan sebagai salah satu capstone project dari Algoritma Academy Data Analytics Specialization. Deliverables yang diharapkan dari projek ini adalah melakukan simple webscrapping untuk mendapatkan informasi.
https://github.com/rickyarians/scrappy-do
beautifulsoup4 data-science data-visualization flask flask-application pandas webscraping
Last synced: 2 months ago
JSON representation
Projek ini dikembangkan sebagai salah satu capstone project dari Algoritma Academy Data Analytics Specialization. Deliverables yang diharapkan dari projek ini adalah melakukan simple webscrapping untuk mendapatkan informasi.
- Host: GitHub
- URL: https://github.com/rickyarians/scrappy-do
- Owner: Rickyarians
- Created: 2023-05-14T12:21:05.000Z (about 3 years ago)
- Default Branch: master
- Last Pushed: 2023-05-14T19:15:09.000Z (about 3 years ago)
- Last Synced: 2025-01-20T09:46:17.126Z (over 1 year ago)
- Topics: beautifulsoup4, data-science, data-visualization, flask, flask-application, pandas, webscraping
- Language: Jupyter Notebook
- Homepage:
- Size: 61.5 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Web-Scrapping using Beautifulsoup
Projek ini dikembangkan sebagai salah satu capstone project dari Algoritma Academy Data Analytics Specialization. Deliverables yang diharapkan dari projek ini adalah melakukan simple webscrapping untuk mendapatkan informasi.
## Dependencies
- beautifulSoup4
- pandas
- flask
- matplotlib
install requirements.txt dengan cara berikut
```python
pip install -r requirements.txt
```
## Rubics
- Environment preparation (2 points)
- Finding the right key to scrap the data & Extracting the right information (5 points)
- Creating data frame & Data wrangling (5 points)
- Creating a tidy python notebook as a report. (2 points)
- Implement it on flask dashboard (2 points)
### The Final Mission
(Hard) Data pekerjaan data di indonesia pada `https://www.kalibrr.id/job-board/te/data/1`
* Dari Halaman tersebut carilah `title pekerjaan` , `lokasi pekerjaan` , `tanggal pekerjaan di post dan dealine submit permohonan`, dan `perusahaan`
* tariklah 15 halaman
* Buatlah plot dari jumlah pekerjaan berdasarkan lokasi.
Happy learning!