twbudget 復活預算視覺化:g0v 起源之作的接棒人
復活預算視覺化:g0v 起源之作的接棒人
g0v 的起點
2012 年,clkao、kirby 等人帶著一份台灣中央政府預算的視覺化作品參加 Yahoo Hackday,拿下佳作。這個專案叫做 twbudget——把國家的錢花在哪裡,用互動圖表讓任何人都能看懂。
獎金不算多,但 clkao 用它辦了一件更大的事:2012 年 12 月的第 0 次 g0v 黑客松。為了這個作品,他們也申請了 g0v.tw 的網域。2012 年 10 月 24 日,g0v.tw 網域註冊當天,就是 g0v 的生日。
twbudget 不只是黑客松的原因,也是黑客松當天繼續在推進的提案之一。那次黑客松的共筆裡,clkao 還在現場把歷年預算資料做成互動式泡泡圖,試著讓每個機關的預算在不同年份之間的消長一目瞭然——正是 twbudget 的核心功能。黑客松的參與者在有趣主題下簽名、討論,政府預算那一頁的流量大概不輸給當天的任何其他提案。
twbudget,是 g0v 的源起之作。Ronny 跟這個專案的誕生毫無關係——他只是後來的接棒人。
資料凍結的六年
twbudget 上線後,成為 g0v 早年最具代表性的展示作品——清楚證明開放資料加上資料視覺化能做什麼。budget.g0v.tw 被引介到義大利及其他國家的公民科技社群,tonyq 也曾把它引入台灣部分縣市政府作為參考工具。
但這個成功背後有個沉默的問題:資料一直凍結在 2012 年。
網站還活著,視覺化還能跑,但顯示的永遠是十年前的數字。沒有人補資料,因為主計總處的預算 Excel 格式複雜、年年有細微差異,轉換起來費工。
2018:自製爬蟲,重新餵養
Ronny 決定自己解決這個問題。2019 年 1 月,twbudget-crawler 建立。這支爬蟲從主計總處下載歷年中央政府總預算的 Excel 檔,解析歲出政事別、歲出機關別、歲入來源別三張表,轉換成 budget.g0v.tw 需要的格式。
格式每年都不太一樣,腳本要一一對付。但從 2018 年起,budget.g0v.tw 的資料開始追上現實——一年一年,從 2012 補到 2025 年。
一個還沒解開的題
但這只是「中央政府總預算」——Ronny 心裡清楚,這只是整個政府預算的目錄,資料量可能不到 5%。真正重要的是單位預算,那才有錢花在哪裡的細目。還有台灣二十幾個縣市,每個都有自己的一套總預算和單位預算,完全沒有被觸及。
早年也有些機關響應國發會 2016 年的開放資料標章,把預算書轉成 XML,Ronny 試過幾次整合,但各機關各做各的,XML 格式有數十種之多,完全無法統一。這題每次嘗試都碰壁,停在那裡好幾年。
直到 2025 年,才有了新的突破口——那是 OpenBudget 的故事。