tw-campaign-finance 開放政治獻金
2004 年,台灣通過《政治獻金法》,要求候選人申報所有收支明細,並由監察院負責公開。制度上是一大進步——但公開的方式,是把申報書掃描成 PDF,以整份文件的形式放到網站上。一張張數位化的紙,藏著錢從哪裡來、往哪裡去的所有資訊,卻完全無法被搜尋、無法被分析、無法被監督。
2014 年 2 月,反核四的公民運動如火如荼,有個叫「反核456」的團體帶著一批檔案走進 g0v 社群——94 個 PDF,合計 2600 頁,全是候選人的政治獻金申報書,全是掃描影像。他們想知道:核電廠周邊的政治人物,收了誰的錢?
這批資料就這樣落到手上。
PDF 掃描檔最難處理的問題不是 OCR,而是格式。監察院的申報書是表格式的文件,每頁數十個欄位,每個候選人的頁面排版微妙不同。解法是:把 PDF 轉成圖片,偵測表格格線,沿著格線把每一個格子切出來——這個動作叫「切豆腐」。94 份文件、2600 頁,切出了 30 萬個小格子,每一格都是一張圖片,等著被人工輸入。
tw-campaign-finance 做的就是這件事——把原始 PDF 變成可以讓人協作填寫的豆腐。
2014 年 4 月 19 日,第八次黑客松(解除戒嚴黑客松),帶著這 30 萬格豆腐去提案(提案照片)。ctiml 跳坑,主力開發出了群眾外包協作填寫平台 campaign-finance.g0v.ctiml.tw——每一格小圖片都可以讓人輸入、讓人驗證。自己則做了豆腐展示和 API 平台 campaign-finance.g0v.ronny.tw,讓資料可以被查詢取用。黑客松結束後協作持續進行,一週後每個格子平均已經被五個不同的人輸入過,用多數決確保正確性。成果在當天的 demo 影片中留下了紀錄:youtu.be/Pu8Q5jD4nFM。
資料出來了,接著是分析。用 GovCash 把政治獻金資料和公司登記資料對比,找出企業和政治人物之間的金流關係。整個流水線逐漸成形,後來連第七屆立委的資料也全數數位化,不再只靠黑客松現場的人力,而是有一套半自動化的處理流程。
但資料的來源只靠網路上找到的 PDF 還不夠。有一群人組成了「調查兵團」,輪流親自前往監察院,把一份份申報書印出來,帶回來繼續切豆腐、繼續輸入,讓覆蓋範圍越來越完整。
資料做出來是一回事,更重要的問題是:為什麼監察院的資料要等到 g0v 的人來數位化?
**開放文化基金會(OCF)和公民監督國會聯盟(公督盟)**以這批資料為基礎,開始推動修法。具體的訴求是修改監察院「政治獻金會計報告書查閱辦法」第九條,讓申請人可以攜出 PDF 電子檔,同時修改第 21 條,要求會計報告書應公開於電腦網路。
倡議過程留下了詳細的會議紀錄:5 月召開策略會議,公督盟提出多層次倡議路徑;7 月先後拜訪監察院,承辦單位表示「帶回討論考慮」;同時也向立委李應元、陳其邁爭取到提案修法。一步一步推,每一次拜會都留下紀錄,當成下一次的施壓依據。
這個倡議也延伸到媒體。READr 以這批開放資料為基礎,發起了《數讀政治獻金》專題,把新一屆候選人的政治獻金資料公開並做成報導,讓更多讀者能直接看到金流的全貌。
倡議的過程花了幾年。2018 年 6 月 20 日,《政治獻金法》修正案通過。2019 年 8 月,監察院正式上線政治獻金查詢平台,明細資料直接在網路上可以搜尋。
g0v 社群裡很少有專案能走到制度真正改變的那一步——從切豆腐的工程師、持續跑監察院的調查兵團、推門拜會的 OCF 和公督盟、把資料做成報導的 READr,這是一個完整的接力。
不過故事還沒結束。資料上線是一個里程碑,但問題從來不只是「能不能看到」,還有「能不能即時看到」、「看到的是不是全貌」。選後九個月才公開、廣告費用不算政治獻金、公司付薪水給競選工作者也游走在灰色地帶——這些問題,至今仍在倡議中。