pcc.g0v.ronny.tw

標案資料 API

📅 2017-11-20 💻 PHP ★ 31 stars 🍴 16 forks

2017 年 7 月,在第 25 次 g0v 黑客松上,提了一個公民請願提案:要求政府網站在頁面上直接標註標案資訊與承包商——讓民眾瀏覽政府網站時,就能看到這個單位把錢花給誰了。提案需要 60 天內集到 5000 人連署,門檻不低。

請願的結果如何已不可考,但這個問題繼續在腦子裡轉。政府電子採購網確實有公開標案資料,但介面設計成只能一筆一筆慢慢查,沒有辦法大量下載、沒有 API、也無法做系統性的分析。這樣的「公開」,對研究者或公民監督來說幾乎沒有實際用處。

五個月後,2017 年 11 月,直接動手做了 pcc.g0v.ronny.tw——把政府電子採購網的標案資料抓下來,整理成可以批次查詢的 API。

爬蟲的邏輯一貫如此:不求快,求不影響原始網站。用慢速、低頻率的方式抓,讓政府網站感覺不到有人在大量取用。這個習慣來自一個原則——公民科技用的是公共資源,不能給對方造成負擔。

現有資料抓起來了,但歷史資料是另一個工程。2020 年 7 月 10 日,開始往回補抓,一路慢慢爬,一直到 2022 年 2 月 27 日才把歷史資料補齊——前後花了將近一年八個月。

資料從 2017 年到現在每天更新一次。跟公司資料一樣,每天早上花十秒下個指令,一直沒有動力把它自動化。十秒的事,總覺得不值得花時間設定自動化。

API 上線後,有人開始拿來用。g0v 的「大河小溪齊督工」專案從標案資料裡篩選出河川整治相關的標案,做成公民監督工具;學術圈也陸陸續續有論文引用這份資料做研究。2023 年另外做了 pcc-viewer,把 API 包成前端界面,讓不會用 API 的人也能直接查詢。


提案影片g0v 第 25 次黑客松

在 g0v 大松的紀錄

第25n 一綱多本黑客松 2017-07-01
提案
政府網站顯示標案資訊和承包廠商
標案 / 開放 / join