Forskningsresultater må presenteres med data

Onsdag 15. november lanserte SPARC Europe nettsidene European Open Data Champions. Nettsidene skal inspirere forskersamfunn til å gjøre forskningsdata åpent tilgjengelige. 

Bilde av Alexander Refsum Jensenius

SPARC Europe er en frivillig organisasjon som arbeider målrettet for åpen vitenskap med fokus på Open Access, åpen utdanning og åpne data i en europeisk setting.

Hittil er det fjorten Open Data Champions i Europa som er intervjuet om blant annet hvorfor man skal gjøre forskningsdata åpent tilgjengelig. Førsteamanuensis og nestleder for SFFet RITMO Alexander Refsum Jensenius ved UiO er en av dem. Her er intervjuet som ble publisert på engelsk på nettstedet European Open Data Champions:

Hvorfor vil du så gjerne dele dataene dine?
Først og fremst fordi det er umulig å validere forskningsresultater uten å ha tilgang til dataene, metodene og verktøyene som ble brukt til å generere de aktuelle funnene. Derfor er forskningsresultater som publiseres uten medfølgende data, etter mitt syn ufullstendige. En annen viktig begrunnelse er at data bør gjøres tilgjengelige for gjenbruk. En mengde data analyseres bare fra en bestemt vinkel og kunne med fordel ha vært behandlet med andre metoder eller vært koblet sammen med andre data. Den tiltagende bruken av maskinelle læringsmetoder er en positiv drivkraft her, ettersom slike metoder krever store datasett for å fungere godt. Det er få forskere som er i stand til å generere omfattende mengder (meningsfulle) data på egen hånd, men i fellesskap kan vi bygge noen virkelig spennende databaser.

Hvordan er du selv engasjert i åpne data?

Jeg prøver å dele data, men det er ikke enkelt. Som musikkforsker opererer jeg med temmelig store og komplekse datasett. Vi arbeider med lyd- og bildeopptak i flere kanaler,

Som musikkforsker opererer Alexander Refsum Jensenius med store og komplekse datasett.

opptak av bevegelse i naturlig størrelse samt fysiologiske sensordata, og med både kvalitative og kvantitative spørreundersøkelser og intervjuer. Vi sliter med å finne gode måter å synkronisere og lagre alle disse dataene på til eget bruk, spesielt fordi mange av dataene kommer fra merkevarebeskyttede systemer. Dette gjør det vanskelig å dele datasettene våre på en koherent, konsistent og veldokumentert måte. Det er ikke nok å plassere en mengde filer på en server; dataene må ha ordentlige metadata for å kunne være nyttige for andre. Det gleder meg å se det økende antallet arkiver for datadeling som dukker opp i disse dager, men jeg synes vi også bør stille spørsmål ved kvaliteten på dataene i enkelte av disse arkivene. Vi risikerer dessuten å havne i samme situasjon som den vi hadde når det gjaldt publikasjoner – at noen få kommersielle aktører dominerer markedet.

Med en erkjennelse av disse problemene som bakteppe er jeg for tiden engasjert i flere forskjellige initiativer for å strukturere multimodale/multimediadata og tilknyttede metadata. Det er mange tekniske utfordringer, men vi behandler også spørsmål knyttet til personvern og opphavsrett. Jeg må innrømme at det kan være frustrerende til tider. Jeg er primært interessert i å oppdage nye ting om hvordan vi opplever musikk, men bruker mye tid på tekniske og juridiske spørsmål. Og likevel, hvis jeg tenker ti år tilbake i tid, ser jeg med glede at det har skjedd store fremskritt!

For meg er det meningsløst å snakke om åpne data uten å nevne de andre aspektene ved åpen vitenskap. Hvis noen ønsker å kontrollere mine forskningsfunn, må de ha tilgang til både dataene og programvaren som ble brukt i analysen (dvs. metodologien). Det er derfor jeg deler programvarekoden min på GitHub (https://github.com/alexarje/). Jeg velger også Gold Open Access-tidsskrifter så ofte jeg kan, og arkiverer selv manuskripter i det digitale biblioteket ved Universitetet i Oslo – DUO.

Hvordan får du andre til å dele sine data? 

Jeg snakker til enhver tid (positivt!) om åpen vitenskap til kolleger og studenter, og jeg ser at det har en effekt å fokusere på emnet. Selv tidligere skeptikere er nå interessert i å høre om mine erfaringer. Jeg snakker også mye om åpen vitenskap i de forskjellige organisasjonene jeg er engasjert i. For eksempel, som leder av styringsgruppen for NIME, International Conference on New Interfaces for Musical Expression (www.nime.org), taler jeg varmt for nye måter å publisere data på i tillegg til forskningsresultater og koder. Det er spesielt viktig i dette miljøet, ettersom det er mange uavhengige forskere og artister som deltar uten støtte fra noen institusjon.

Hva gjenstår å gjøre for å få flere til å dele, og hva gjør deg optimistisk med tanke på den åpne vitenskapens fremtid?

Selv om mye er blitt bedre, gjenstår det fortsatt mange problemer som må løses før åpne data blir førstevalget til mange forskere. Det omfatter løsninger for lagring som er like brukervennlige som populære kommersielle programmer, men med de forskriftene for personvern og opphavsrett som er nødvendige for forskningen. Standardisering av åpne dataformater er også avgjørende, ettersom merkevarebeskyttede og/eller lukkede formater florerer i forskningsmiljøene. Det er også svært viktig at det utvikles bedre løsninger for å inkludere metadata på en effektiv måte. Her trenger vi mer samarbeid mellom bibliotekarer, IT-teknikere og forskningsadministratorer. Heldigvis er det for tiden iverksatt flere tiltak for å få bukt med problemene jeg har skissert ovenfor. Det jeg ønsker, er at vi kommer frem til et sett med standardiserte, men likevel fleksible løsninger som er åpne nok til å håndtere allslags merkelige ting i fremtiden.
 

Til slutt, hva tror du ville skje hvis offentlige forskningsdata fortsatte å være lukkede, og hvordan tror du en verden med atskillig mer åpne data ville se ut?
Lukket forskning er i beste fall uheldig. I verste fall kunne det være direkte skadelig. Det virker også som en hemsko og står i veien for innovasjon. Jeg er overbevist om at åpen forskning er fremtiden!

Er det noe annet du gjerne vil føye til?
Selv om den politiske kampen for publisering med åpen tilgang mer eller mindre er vunnet, befinner vi oss for øyeblikket i en kritisk fase når det gjelder videre utbredelse. Den økonomiske siden av publisering med åpen tilgang er fortsatt i en omstillingsfase, og det er en viss motstand blant enkeltpersoner og på departementalt nivå. Det er et paradoks at mange unge forskere er blant de mest villige til å tilpasse seg publisering med åpen tilgang, selv om de også er blant de mest sårbare.

Jeg har problemer med den konservative holdningen til åpen vitenskap som kommer til uttrykk i mange komitérapporter og anonyme fagfellevurderinger. Det er derfor jeg taler for mer åpenhet også i slike prosesser. Ved UiO gjør vi alle ansettelsesprosesser så gjennomsiktige som mulig. Samtlige kandidater til en stilling kan lese evalueringen av de andre søkerne for å se at evalueringen ikke er partisk. Jeg har også foreslått et system med «åpen finansiering» for Norges forskningsråd. Det vil si at både søknadene og vurderingene ville vært gjort tilgjengelige for alle. Folk er redde for at andre skal stjele deres ideer, men det er ikke noe problem hvis alle publiserte dokumenter har DOI-nummer, tidsstempel og versjonskontroll. Jeg er sikker på at et slikt system ville føre til bedre søknader, bedre evalueringsprosesser og til syvende og sist til bedre prosjekter.
 

Publisert 23. nov. 2017 17:40 - Sist endret 24. nov. 2017 00:09