本文為文化內容策進院 TAICCA X  開放實驗室 OCF Lab 合作企劃

資訊爆炸的今日,博學強記不再是獲取知識的唯一途徑,即時找到正確、可靠的資料,往往更是工作上的決勝關鍵。Metadata,正是讓我們輕鬆撈到資料和加速數位資料鏈結的好幫手!

作者:陳廷彥(主筆);OCF Lab 與 文化內容策進院

(Photo credit by geralt on Pixabay)

想像你坐擁一個收有一千萬本書的圖書館,你要怎麼讓讀者可以輕易找到想要的資料?最基礎的一步,就是必須把這些圖書資料們的作者、標題、出版年份、出版者等內容一一記錄下來,才能進一步幫它分類,並讓讀者能利用這些描述館藏的基本資料,查到自己想要的書。
當今天這個館藏是圖畫、書刊、藝術品、數位影音等文化產物的資料,協助在線上索引和記錄文化館藏的「關於資料的資料」就是「Metadata」(後設資料,也譯為「詮釋資料」)。

(製圖:OCF Lab;蒙娜麗莎圖片取自維基百科

無論對於資料的提供者、管理者或使用者,Metadata 的重要性不亞於資料本身:

  • 資料系統化管理與分類:對資料的管理者而言,最顯而易見的用處是 Metadata 提供了分類的標準,讓龐雜的資料不再四散各處,可以被有系統地分類與管理。
  • 利於資料搜尋:系統性分類標準的建立亦有助於促進資料的「可發掘性」,讓使用者可以輕易地找到有用的資料;另一方面,對於提供資料的人而言,也能讓自己的心血在茫茫資料海中更有機會脫穎而出。
  • 促進資料流通與傳播:由於共享同一套分類標準,Metadata 能使作品的記錄可以在不同資料庫之間互通,提高其流通程度。
  • 幫助資料長期保存:透過記錄資料的流通歷史與物理特徵,資料管理者在資料遺失時可以更容易追蹤去處與複製,有助於資料的永續保存與傳承。

因為 Metadata 在這些層面的重要性,任何有大量資料的地方,都需要 Metadata。除了通用的「都柏林核心」(Dublin Core)系統界定了十五個 Metadata 的主要元素,各個領域也都有自己的 Metadata 系統:圖書資料有「MARC」標準,博物館社群有「CDWA」標準,植物標本館有「HISPID」標準等。而在近年來獲得大量關注的開放資料領域,國內外也紛紛建立起用來描述開放資料集的 Metadata 規範,例如台灣的國發會就訂定了「資料集詮釋資料標準規範」。

如果沒有完善的 Metadata 標準,會導致什麼問題?去年國外媒體 The Verge 就撰文指出,音樂產業由於缺乏共通的 Metadata 系統,關於音樂作品的資料四散各處、沒有集中管理,結果資料常常打錯,或在資料庫之間轉移時被遺漏。這不但時常讓音樂的搜索變得困難,許多參與音樂創作的音樂人名字更因此沒有出現在資料庫中,也就拿不到應有的收入。根據估計,高達25% 的版稅因此沒有付給發行公司,或被付給了錯誤的機構。也因為如此,近來開始有音樂人倡議建立音樂產業的 Metadata 標準「MEAD」,希望改善這樣的窘境。

由此可見,Metadata 看似只是微不足道的技術細節,但其實左右資料的流通與運用,更可能嚴重影響創作者和文化內容業者的生計。因此,建立縝密、統一的 Metadata 系統,可說是在這個資訊爆炸的年代,從事資料數位化的重要任務。


參考資料:


本文章授權條款採 CC 授權 BY (姓名標示) 4.0

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.