Modulis 8: Teorinė dalis

Atvirieji mokslo duomenys ir mokslo duomenų valdymas

Tyrimus finansuojančios institucijos kelia reikalavimus tyrėjams tiek dėl mokslinių publikacijų skelbimo atvirosios prieigos žurnaluose ir (ar) talpyklose, tiek dėl mokslo duomenų paskelbimo atvirojoje prieigoje (Komisijos rekomendacija (ES) 2018/790 dėl prieigos prie mokslinės informacijos ir tos informacijos išsaugojimo, 2018).

Mokslinių tyrimų duomenys yra bet kokia informacija, kuri buvo surinkta vykdant stebėjimus, apklausas, atliekant eksperimentus ir kt. tyrimų metu ir naudojama originalių mokslinių tyrimų rezultatams patvirtinti. Tyrimų duomenys apima pirminius duomenis, kurie renkami naudojant sensorius, instrumentus, prietaisus, atliekant stebėjimus ir apklausas, naudojant kitus duomenų rinkimo būdus (Managing and Sharing Research Data).

Europos mokslinių tyrimų integralumo elgesio kodekse (ALLEA. The European Code of Conduct for Research Integrity, 2017) apibrėžti reikalavimai tyrėjams, mokslo institucijoms ir organizacijoms, kuriais skatinama užtikrinti tinkamą mokslo duomenų, tyrimo medžiagos, tarp jų ir nepublikuotos, saugojimą numatytą laikotarpį. Pagrindiniai principai, kurių turėtų būti laikomasi vykdant mokslinius tyrimus:

  • patikimumas mokslinių tyrimų kokybė turi atsispindėti projekto metodikoje, analizėje ir naudojant išteklius;
  • sąžiningumas  moksliniai tyrimai visuose vykdymo etapuose turi būti vertinami, komunikuojama skaidriai, sąžiningai, išsamiai ir nešališkai;
  • pagarba kolegoms, mokslinių tyrimų dalyviams, visuomenei, ekosistemai, kultūros paveldui ir aplinkai;
  • atskaitomybė už tyrimą nuo idėjos iki publikavimo: už tyrimo valdymą ir organizavimą, mokymą, priežiūrą ir mentorystę, jo metu gautų rezultatų platesnį poveikį.

Atvirieji duomenys yra tokie, kurie yra prieinami, jais naudotis ir dalytis gali kiekvienas. (What is open data?).

Duomenų atvirumas susijęs ne tik su prieigos sąlygomis, bet ir su galimybe juos naudoti. Atvirieji duomenys turi būti licencijuojami nurodant naudojimosi sąlygas, suteikiant leidimą dalytis, keisti, sujungti ir kitaip naudoti ne tik moksliniais ar asmeniniais, bet ir komerciniais tikslais. Tam naudojamos Kūrybinių bendrijų (angl. Creative Commons, CC) licencijos, rekomenduojama CC-BY licencija. Plačiau apie tai  žr. modulyje Autorių teisės ir Kūrybinių bendrijų licencijos.

Naudojant mokslinių tyrimų duomenis keliami esminiai reikalavimai: skaidri prieiga, citavimas ir tinkamas naudojimas, suderintas su autorių teisių apsauga ir intelektinės nuosavybės reikalavimais.

Duomenų kūrimas ir tvarkymas siekiant padaryti juos prieinamus reikalauja laiko ir finansinių išteklių. Prieiga prie duomenų gali būti mokama, tačiau kaina neturėtų viršyti jų atgaminimo kaštų. Aktualiems ir didiesiems duomenims (angl. big data) tvarkyti reikalingos nuolatinės išlaidos, susijusios su patikimų paslaugų teikimu. Tim Berners-Lee rekomenduoja 5 žvaigždučių atvirųjų duomenų diegimo schemą (5* Open Data), kuri pateikia skirtingo atvirumo lygmens duomenų prieinamumo kainą ir naudą.

Mokslo duomenų valdymas turi būti vykdomas visuose mokslinio tyrimo etapuose: planavimo, vykdymo ir skelbimo. Mokslininkas turi numatyti tyrimo rezultatų ir mokslo duomenų prieigos, saugojimo ir publikavimo sąlygas (žr. 3 pav.).

3 pav. Duomenų valdymas konkrečiais mokslinio tyrimo etapais

*Rekomenduojami duomenų žurnalai:

Duomenų atvirumas gali skirtis priklausomai nuo prieigos ir naudojimo sąlygų:

  • atvirieji duomenys (pvz., oro temperatūra, žemės drebėjimų matavimai ir kiti laisvai prieinami duomenys) – prieiga suteikiama visiems, duomenimis gali naudotis ir dalytis kiekvienas. Duomenų savininkas turi suteikti leidimą ir nurodyti, kad duomenis galima naudoti bet kokiu būdu ir tikslu;
  • pasidalytieji duomenys (pvz., prekybos centrų klientų apsipirkimo įpročiai, rinkimų registrai) – jais dalijamasi tarp konkrečios grupės asmenų, siekiančių konkrečių tikslų;
  • uždarieji duomenys (pvz., nacionalinio saugumo, verslo ataskaitos, mobiliųjų telefonų naudojimo duomenys (Open/Shared/Closed: The world of data) yra prieinami tik organizacijos viduje.

Mokslinių tyrimų duomenys, gauti įgyvendinant viešosiomis lėšomis finansuojamus mokslinius tyrimus, turi būti tvarkomi naudojant skaitmeninę infrastruktūrą ir suderinant su FAIR (angl. findable, accessible, interoperable, reusable) principais: turi būti surandami, prieinami, sąveikūs ir pakartotinai panaudojami saugioje ir patikimoje aplinkoje, išskyrus atvejus, kai tai neįmanoma arba nesuderinama su tolesniu mokslinių tyrimų rezultatų panaudojimu („kiek įmanoma, atviri, kiek būtina, uždari“) (Komisijos rekomendacijos (ES) 2018/790 dėl prieigos prie mokslinės informacijos ir tos informacijos išsaugojimo, 2018; The FAIR data principles: findable, accessible, interoperable, re-usable, 2016; Wilkinson et al., 2016). Jeigu duomenų negalima atverti dėl privatumo, komercinių paslapčių, nacionalinio saugumo, teisėtų komercinių interesų ir trečiųjų šalių intelektinės nuosavybės teisių, turi būti paaiškinama, kodėl atviroji prieiga yra negalima.

Lietuvos mokslo tarybos patvirtintose Atvirosios prieigos prie mokslo publikacijų ir duomenų gairėse (2016 m. vasario 29 d. nutarimas Nr. VIII-2) įvardijami atvejai, kada atvirosios prieigos prie mokslo duomenų nuostatos gali būti netaikomos:

  • duomenys nebuvo gauti projekto įgyvendinimo metu arba mokslinė publikacija nėra paremta originaliais duomenimis, t. y. jie nebuvo surinkti ir (ar) sukurti projekto metu;
  • reikia apsaugoti rezultatus, ketinant duomenis panaudoti komercinimo ar pramonės vystymo tikslais;
  • duomenų atvėrimas nesuderinamas su konfidencialumo reikalavimais;
  • duomenų atvėrimas prieštarautų asmens duomenų apsaugos reikalavimams;
  • duomenų atvėrimas trukdytų pasiekti projekto tikslus;
  • yra kitų teisėtų priežasčių neatverti duomenų.

Tyrėjai, priimdami sprendimą dėl duomenų atvirumo, turi atsižvelgti į teisinius, etinius ir komercinius duomenų apsaugos klausimus:

  • jeigu tyrimas susijęs su žmonėmis, turi būti gautas tiriamųjų sutikimas dėl ilgesnės trukmės duomenų saugojimo ir pakartotino naudojimo. Ilgalaikiam saugojimui skirti duomenys turi būti išvalyti ir (ar) anonimizuoti;
  • jeigu duomenys atliekami su partneriais, turi būti pasirašyti susitarimai ir juose aptartos duomenų naudojimo ir dalijimosi sąlygos, numatant, kurie duomenys yra atviri, o kurie uždari;
  • planuojant tyrimą turi būti numatyta infrastruktūra ir sąlygos, kaip duomenys bus saugomi, kaip bus užtikrinamas jų saugumas, kaip jais bus dalijamasi, kam bus suteikta prieiga;
  • pasirenkant duomenų talpyklą ilgalaikiam duomenų saugojimui turi būti įvertintos talpyklos galimybės suteikti ribotą prieigą konkrečiai bendruomenei pagal prašymą ir autentifikaciją;
  • pakartotinio panaudojimo atveju turi būti numatyta galimybė gauti duomenų naudotojų sutikimą duomenis naudoti laikantis tam tikrų taisyklių ir sąlygų.

Ne visi tyrimo metu sukaupti duomenys turi būti saugomi pasibaigus tyrimo projektui, rekomenduojama išsaugoti tuos duomenis, kurie reikalingi publikuojamiems tyrimo rezultatams validuoti. Skaitmeninės priežiūros centras (Digital Curation Centre (toliau – DCC) parengė rekomendacijas, padedančias nuspręsti, kuriuos duomenis reikia saugoti pasibaigus tyrimui (DCC, 2014).

Duomenų FAIR principų įvertinimo įrankis padeda nustatyti, kaip duomenys atitinka reikalavimus, ir padeda pagerinti duomenų kokybę (FAIR self-assessment tool).

Siekiant atvirojo mokslo tikslų, yra kuriamos bendros mokslinių tyrimų infrastruktūros (European Strategy Forum on Research Infrastructures (ESFRI) Roadmap, 2018), skirtos mokslo rezultatams išsaugoti.