作者:柯皓仁
2016年,「科學資料管理與治理的FAIR指導原則( FAIR Guiding Principles for scientific data management and stewardship )」發表在《科學資料(Scientific Data)》雜誌上。作者藉由提供指南,以提高數位資產的可發現性(Findability)、可取用性(Accessibility)、可互操作性(Interoperability),以及再使用性(Reuse)。 這些原則強調機器的可操作性(即電腦系統在沒有或最少人為干預的情況下查找、取用、互操作和再用資料的能力),因為資料的數量、複雜性和創建速度的增加,使人類越來越依賴電腦支援來處理資料。
可發現的(Findable)
使用或再使用資料的第一步是找到它們。詮釋資料(metadata)和資料本身應該很容易被人類和電腦找到。機器可讀的詮釋資料對於自動發現資料集和服務至關重要,因此這是FAIR化過程的重要組成部分。
- F1. 詮釋資料和資料本身被分配一個全域唯一和持久的識別碼。
- F2. 使用豐富的詮釋資料描述資料(由下面的 R1 定義)。
- F3. 詮釋資料清晰明確地包含它們所描述資料的識別碼。
- F4. 詮釋資料和資料本身在可搜索的資源庫中註冊或編製索引。
可取用的(Accessible)
一旦使用者找到所需的資料,使用者需要知道如何取用這些資料,可能包括身份驗證和授權。
- A1. 詮釋資料和資料本身可藉由其識別碼,使用標準化通信協定進行檢索。
- A1.1 該協定是開放的、免費的、可普遍實施的。
- A1.2 該協定允許在必要時進行身份驗證和授權。
- A2. 即使資料不再可用,也可以取用其詮釋資料。
可互操作的(Interoperable)
FAIR 原則的最終目標是優化資料的再使用。為此,應詳細描述詮釋資料和資料本身,以便可以在不同的情境中複製和/或組合它們。
- R1. 詮釋資料和資料本身應採用多個準確和相關的屬性來詳細描述。
- R1.1 詮釋資料和資料本身應連同清晰且可取用的「資料使用許可(data usage license)」一同發佈。
- R1.2. 詮釋資料和資料本身應包含「詳細出處(detailed provenance)」。
- R1.3. 詮釋資料和資料本身應符合與領域相關的社群標準。
上述原則涉及三種類型的實體:資料(或任何數位物件)、詮釋資料(有關該數位物件的資訊)和基礎設施。例如,原則 F4 定義了詮釋資料和資料都在可搜索的資源庫(基礎建設元件)中註冊或編製索引。
https://www.go-fair.org/fair-principles/
本文採:Creative Commons Attribution 4.0 授權