作者:林冠廷 | 編輯:OCF Lab
2020 COSCUP 開源人年會即將在 8月第一個周末登場,在這之前,先來看看特派記者筆下, 2019 COSCUP 有哪些精彩時刻。
開源科技使用在公共社會議題已經越來越平常,但是如何將與網路科技似乎相差甚遠的大自然,也納入開源行列,彷彿難以想像。兩個以科技視角關懷臺灣自然環境的專案分享,要讓大家感受不一樣的開源力量。
AI 不只可以下圍棋,這群工程師還要用 AI 讓你找回與土地的連結
在八月一個豔陽高照的週六早上,臺灣知名公民科技社群 g0v.tw (零時政府)在COSCUP 當中包辦了一場社群軌,聚集了幾十名 g0v 成員與開源社群參與者,即使冷氣停擺,人人汗如雨下,但依舊沒有破壞大家的興致。這群人在此,是為了瞭解 2018 年 g0v 公民科技獎助金得主「智慧型植物辨識圖鑑 App」令人興奮的 AI 技術成就。這 App 的主要特色是,團隊先自行訓練出一個植物辨識的 AI 模型,透過這個模型,使用者只要在手機下載 App,就可以用手機鏡頭辨識植物。
這個熱愛臺灣自然的團隊由 AI 工程師 Ru Lu、iOS 開發者 Denken、Android 開發者 Prada、設計 Wanyu,與曾經任職於 Google DeepMind /AlphaGo 開發工程師 Fumin 組成。這場演講幾位團隊成員更嘗試使用台語介紹「修煉植物辨識的辛酸」,雖然其中幾位工程師的台語還在練習,不過演講內容完全不打折扣,如果錯過他們的精彩演講,也可以看影片回顧。
Denken 解釋要用 AI 辨識植物種類,最基本的問題在於收集資料時,不同國家的植物名稱也有所不同。以臺灣的洋紫荊為例,在中國叫做「羊蹄甲」;但臺灣的羊蹄甲,在中國卻反過來叫做「洋紫荊」。又因為不同書本、網路資料的植物名稱可能混用,團隊最後改使用學名分辨,才得以避免更多混淆。
在 AI 正紅的當代,多數工作都已經有了開源的解決方案,因此團隊不需耗費太多心力。然而,困難之處在於,訓練 AI 需要龐大的資料庫,規模多達數十萬、數百萬張相片之譜。一般的開源成果頂多包含汽車、貓狗這種粗略的分別,所以要能精確辨認幾十種植物,團隊依舊需煞費苦心。當時團隊手上不過 2 萬 5 千張相片,不足以訓練所用。所幸 Ru Lu 指出還有兩項法寶:第一是「data augmentation (資料增強) 」,也就是不斷將一張圖進行多樣微調,像是調整色調、光線、水平垂直翻轉、或裁切不同角度,只要一個小變化,就可以大大增加訓練 AI 的照片數量,也是比較經濟且可幫助 AI 學習的方法。
如果「data augmentation」生出來的新圖不夠,團隊還會使用「transfer learning (遷移學習) 」,把原本已經有一部分訓練成果可用的模型,加以修改差異之處,讓植物辨識也能適用。Ru Lu 以神經網路的階層解釋,從圖像的輸入開始,經過層層處理才會得出結果。但團隊可以借用前人多數成果,例如說別人的模型可以分辨汽車,團隊就只需要修改其中一層:「若是有人已經代先替你訓練過,英語叫做 pre-train 過啊,咱就無需要家己對他來訓練。咱干焦需要重新訓練 softmax 的層就好啊。」
團隊最初訓練的植物以大安森林公園為主,目前成果已經可以下載安裝到手機中使用。透過科技的力量,臺灣人或許可以慢慢找回對土地的認識,讓線上工具可以在實際生活的環境中,發揮正向的力量。
耕耘環保的藝術工作者,要用程式語言追蹤河川
河川保育如果跟藝術結合在一起,可以變成什麼樣子?位於淡水的竹圍工作室給出的答案可能會讓你意想不到:開放資料整合平台。
竹圍工作室是一個於竹圍在地耕耘 24 年的藝術村,見證台北四分之一世紀的河川政策演變,自己淹過好幾次大水之後,代表竹圍工作室到 COSCUP 分享新計畫的高任祥就說:隨著氣候變化,現在台灣急降雨愈來愈嚴重,過去河川整治的方法不見得還有用。
2011年,竹圍工作室與藝術家吳瑪俐以工作室附近的樹梅坑溪為主角,發起「樹梅坑溪環境藝術行動」,跟社區居民一同藉由行動、活動共度了許多時光,有一天他們赫然發現,政府默默對樹梅坑溪進行了整治工程,除了河道兩側水泥化,底下也用大石頭鋪平。雖然對於排水、計算水利效益有很大幫助,但生態破壞也大。明明花費這麼多心力關心這條溪流的他們,居然都等到樹梅坑溪完工後才發現,那一般忙著上班上課的河溪愛好者,又要怎麼追蹤河川近況?十年來,單一行政區的各類淡水工程,最高已經花費超過120億元公帑,且發包單位從水利局到殯葬管理所都有,根本無從追蹤。有工程背景的高任祥,因此決定與同事合作提出「大河小溪全民齊督工」計畫。
這個計畫分為三個部分:第一是整合政府標案平台資料,只要民眾關心的水系有了工程,就會透過開源、中文化的 Slack 替代軟體「Mattermost」通知使用者。第二部分是收集河川資料的來源,則透過群眾共同編寫的 Wikidata 取得;每個月竹圍工作室會利用 Wikidata Query 抓取一次河川資料,也會將整理過後的新版本批次上傳回 Wikidata,達成互利互惠的效果。標案與河流的資料整理再匯集成第三部分,即自己開發的「大河小溪地圖平台」,不但可一次閱覽標案、水系,還可以協助上傳圖資。
2019 年分享當時,「大河小溪地圖平台」的設計稿已經到了預計出爐的時間,收集資料的工作也在如火如荼進行中。在去年 5 月中時,「大河小溪全民齊督工」在摩茲工寮辦了 Wikidata 編輯聚,希望不只河川團體參與,開放資料的社群朋友也能加入這個計畫。有了這個平台,竹圍工作室希望不只能監督政府,也可以與一般民眾溝通觀念。以樹梅坑溪為例,其屬淡水河水系的支游,但淡水河整治得再好,只要支流遭到污染,最後還是會相互影響。
** 後記:「大河小溪地圖平台」已經公開上線,並持續精進中。
本文章授權條款採 創用 CC BY (姓名標示) 4.0。
