tw-campaign-finance

開放政治獻金

📅 2014-02-28 💻 HTML ★ 9 stars

2004 年,台灣通過《政治獻金法》,要求候選人申報所有收支明細,並由監察院負責公開。制度上是一大進步——但公開的方式,是把申報書掃描成 PDF,以整份文件的形式放到網站上。一張張數位化的紙,藏著錢從哪裡來、往哪裡去的所有資訊,卻完全無法被搜尋、無法被分析、無法被監督。


2014 年 2 月,反核四的公民運動如火如荼,有個叫「反核456」的團體帶著一批檔案走進 g0v 社群——94 個 PDF,合計 2600 頁,全是候選人的政治獻金申報書,全是掃描影像。他們想知道:核電廠周邊的政治人物,收了誰的錢?

這批資料就這樣落到手上。

PDF 掃描檔最難處理的問題不是 OCR,而是格式。監察院的申報書是表格式的文件,每頁數十個欄位,每個候選人的頁面排版微妙不同。解法是:把 PDF 轉成圖片,偵測表格格線,沿著格線把每一個格子切出來——這個動作叫「切豆腐」。94 份文件、2600 頁,切出了 30 萬個小格子,每一格都是一張圖片,等著被人工輸入。

tw-campaign-finance 做的就是這件事——把原始 PDF 變成可以讓人協作填寫的豆腐。

2014 年 4 月 19 日,第八次黑客松(解除戒嚴黑客松),帶著這 30 萬格豆腐去提案(提案照片)。ctiml 跳坑,主力開發出了群眾外包協作填寫平台 campaign-finance.g0v.ctiml.tw——每一格小圖片都可以讓人輸入、讓人驗證。自己則做了豆腐展示和 API 平台 campaign-finance.g0v.ronny.tw,讓資料可以被查詢取用。黑客松結束後協作持續進行,一週後每個格子平均已經被五個不同的人輸入過,用多數決確保正確性。成果在當天的 demo 影片中留下了紀錄:youtu.be/Pu8Q5jD4nFM

資料出來了,接著是分析。用 GovCash 把政治獻金資料和公司登記資料對比,找出企業和政治人物之間的金流關係。整個流水線逐漸成形,後來連第七屆立委的資料也全數數位化,不再只靠黑客松現場的人力,而是有一套半自動化的處理流程。

但資料的來源只靠網路上找到的 PDF 還不夠。有一群人組成了「調查兵團」,輪流親自前往監察院,把一份份申報書印出來,帶回來繼續切豆腐、繼續輸入,讓覆蓋範圍越來越完整。


資料做出來是一回事,更重要的問題是:為什麼監察院的資料要等到 g0v 的人來數位化?

**開放文化基金會(OCF)公民監督國會聯盟(公督盟)**以這批資料為基礎,開始推動修法。具體的訴求是修改監察院「政治獻金會計報告書查閱辦法」第九條,讓申請人可以攜出 PDF 電子檔,同時修改第 21 條,要求會計報告書應公開於電腦網路。

倡議過程留下了詳細的會議紀錄:5 月召開策略會議,公督盟提出多層次倡議路徑;7 月先後拜訪監察院,承辦單位表示「帶回討論考慮」;同時也向立委李應元、陳其邁爭取到提案修法。一步一步推,每一次拜會都留下紀錄,當成下一次的施壓依據。

這個倡議也延伸到媒體。READr 以這批開放資料為基礎,發起了《數讀政治獻金》專題,把新一屆候選人的政治獻金資料公開並做成報導,讓更多讀者能直接看到金流的全貌。

倡議的過程花了幾年。2018 年 6 月 20 日,《政治獻金法》修正案通過。2019 年 8 月,監察院正式上線政治獻金查詢平台,明細資料直接在網路上可以搜尋。

g0v 社群裡很少有專案能走到制度真正改變的那一步——從切豆腐的工程師、持續跑監察院的調查兵團、推門拜會的 OCF 和公督盟、把資料做成報導的 READr,這是一個完整的接力。


不過故事還沒結束。資料上線是一個里程碑,但問題從來不只是「能不能看到」,還有「能不能即時看到」、「看到的是不是全貌」。選後九個月才公開、廣告費用不算政治獻金、公司付薪水給競選工作者也游走在灰色地帶——這些問題,至今仍在倡議中。

在 g0v 大松的紀錄

第8n 解除戒嚴黑客松 2014-04-19
提案
北市豪宅通
開放空間,容積獎勵,豪宅
提案
開放政治獻金
政治獻金,群眾外包,人工OCR
第56n 真的假的黑客松 x 水保局 2023-07-01
提案
開放政治獻金2023
政治獻金、JOIN平台提案中
短講
白帽駭客?政治獻金資料分析
成果報告
開放政治獻金2023
政治獻金、JOIN平台提案中
第57n 開源普渡黑客松 2023-08-26
短講
開放政治獻金的連署歷程

相關專案