Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/cades/taipei-building-has-reward
台北市建照記錄中有「獎勵」的紀錄
https://github.com/cades/taipei-building-has-reward
Last synced: about 1 month ago
JSON representation
台北市建照記錄中有「獎勵」的紀錄
- Host: GitHub
- URL: https://github.com/cades/taipei-building-has-reward
- Owner: cades
- Created: 2013-03-23T06:32:33.000Z (over 11 years ago)
- Default Branch: master
- Last Pushed: 2013-05-26T05:52:03.000Z (over 11 years ago)
- Last Synced: 2024-10-19T15:51:05.385Z (about 2 months ago)
- Language: Python
- Size: 672 KB
- Stars: 3
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- awesome-g0v - taipei-building-has-reward - 台北市建管處建照記錄 (Open Data Open Gov / 開放資料、開放政府 / 政府運作(區域劃分與統計、法人基本資料、採購資訊與委外營運服務明細、國防與外交))
README
# 專案說明
check_and_push.sikuli 這隻 crawler script 以 ronny 爬下來的[台北建管處建照記錄](http://tpebuilding.g0v.ronny.tw)為資料來源,撈出有「獎勵」關鍵字的執照之url, 存在 record.txt 內。
因為開發時用的瀏覽器是Safari, 故目前只能在Mac OS X 上執行. (若改成用Google Chrome / Firefox 就能跨平台了)# 環境設定
跑script時要打開「Safari」和「Terminal」兩個應用程式。script會在這兩個app間來回切換。
請上github fork一份(記得選ssh, 不要選https, 否則push時會要求輸入username/password),並打開Terminal, cd到專案目錄下.
Safari則打開ronny的建照記錄網頁,選一張建照。script會從該張建照開始,往它的上一張爬。
這樣就好了. script會自動把抓到的url append到record.txt的檔尾,並把這份更動commit、push回去。如果你有爬出一些東西,歡迎發pull request給我。
# 注意事項
1. 由於sikuli運用螢幕截圖,跑script時不能做自己的事,建議在睡覺或電腦不用的時候放著讓它爬。
2. 一張不含「獎勵」關鍵字的建照爬完約40秒,以一年400張建照計,約4.5hr可以跑完一年份的建照。
3. script中有一個delay(4), 那是為了等瀏覽器下載、顯示圖片。如果你所處的環境網路不夠快,這個值可以設大一點。(如果圖片還沒讀完就開始跑...可能會中途crash :P)