zarządzanie danymi badawczymi

zasady fair

Zasady FAIR

Co oznacza akronim FAIR?

Akronim FAIR określa wymogi, które powinny zostać spełnione przez dane badawcze. Zasady te zostały opisane w artykule FAIR guiding principles for scientific data management and stewardship i stanowią ważny punkt odniesienia, przywoływany często w politykach otwartości.

F

Findable – możliwe do znalezienia

  • (meta)dane mają przypisany trwały i unikalny identyfikator 
  • identyfikator danych jest elementem metadanych
  • dane są opisane za pomocą bogatych metadanych
  • (meta)dane są zarejestrowane lub zaindeksowane w miejscu, którego zasoby można przeszukiwać
A

Accessible – dostępne

  • (meta)dane są dostępne z wykorzystaniem standardowego protokołu komunikacyjnego
  • protokół ten jest bezpłatny, otwarty i może być uniwersalnie implementowany
  • protokół ten pozwala w razie konieczności na uwierzytelnienie i autoryzację
  • metadane są dostępne, nawet jeśli dane już nie są dostępne
I

Interoperable – interoperacyjne

  • (meta)dane wykorzystują formalne, dostępne, wspólne i szeroko stosowane języki reprezentacji wiedzy
  • (meta)dane wykorzystują słowniki zgodne z zasadami FAIR 
  • (meta)dane zawierają odpowiednie odwołania do innych (meta)danych
R

Reusable – możliwe do ponownego wykorzystania

  • (meta)dane są bogato opisane za pomocą adekwatnych i istotnych atrybutów
  • (meta)dane są udostępniane z określoną i dostępną licencją na wykorzystanie
  • (meta)dane są związane ze szczegółową dokumentacją dotyczącą pochodzenia (provenance)
  • (meta)dane są zgodne z dziedzinowymi standardami odpowiedniej społeczności naukowej

Praktyczne wskazówki

Jak działać w zgodzie z zasadami FAIR? Większość opisanych poniżej działań jest związanych z wyborem odpowiedniego miejsca przechowywania i udostępnienia danych, najlepiej przystosowanego do tego repozytorium. Inne działania w pełni zależą natomiast od autorów i osób przygotowujących dane do udostępnienia.

F

Dane są możliwe do znalezienia, kiedy są dobrze opisane, mają trwały identyfikator i zamieszczone zostały w serwisach, których zasoby można przeszukiwać, a ich metadane są indeksowane przez zewnętrzne wyszukiwarki i agregatory.

Co zrobić, aby ułatwić innym znalezienie danych?

  • Opatrzyć je trwałym identyfikatorem, najlepiej DOI (ang. digital object identifier).
  • Opisać je metadanymi, najlepiej zgodnymi ze standardami konkretnej dziedziny i dyscypliny.
  • Zdeponować je w odpowiednim serwisie, najlepiej w repozytorium, którego zasoby można przeszukiwać.
A

Dane są dostępne, kiedy ludzie i maszyny mogą uzyskać do nich dostęp na jasnych zasadach i za pomocą standardowych, otwartych protokołów, bądź otrzymać informacje na ich temat, nawet jeśli same dane nie mogły zostać udostępnione w sposób otwarty. W praktyce oznacza to, że dane nie muszą być otwarte, aby być FAIR.

Co zrobić, aby zapewnić dostępność danych?

  • Wskazać warunki dostępu do danych, jeżeli nie są one udostępnione w sposób otwarty.
  • Korzystać z szeroko rozpowszechnionych i standardowych rozwiązań technicznych w udostępnianiu danych, np. zaufanych repozytoriów.
  • W wyjątkowych wypadkach, jeżeli nie można udostępnić danych, udostępnić metadane.
I

Interoperacyjność (meta)danych to możliwość łączenia ich z innymi (meta)danymi, wykorzystywania w wielu różnych systemach komputerowych i analizowania przy użyciu różnorodnego oprogramowania. Kluczowe znaczenie ma wykorzystanie standardów, np. standardowych i otwartych formatów plików czy standardów metadanych.

Co zrobić, aby zapewnić interoperacyjność danych?

  • Udostępnić dane w standardowym formacie, najlepiej otwartym.
  • Skorzystać z odpowiednich standardów metadanych i słowników kontrolowanych.
  • Wskazać powiązania z innymi danymi bądź publikacjami.
R

Zapewnienie możliwości ponownego wykorzystania danych to najważniejszy cel zasad FAIR. Osiągnięcie go jest możliwe, kiedy dane są dobrze i rzetelnie opisane. Pozwala to na określenie wiarygodności danych i adekwatności ich ponownego wykorzystania w odniesieniu do zakładanych celów. Ważne jest korzystanie z wolnych licencji.

Co zrobić, aby zapewnić możliwość ponownego wykorzystania danych?

  • Przygotować odpowiednią dokumentację i udostępnić ją wraz z danymi.
  • Korzystać ze standardowych wolnych licencji, które mają postać możliwą do odczytu maszynowego, np. z licencji Creative Commons.