English version of this page

Metadata og dokumentasjon

God datadokumentasjon og metadata er essensielt for å kunne gjøre forskningen reproduserbar og forståelig, både for andre og for deg selv, når du en gang i fremtiden skal bruke det samme datasettet. 

Metadata

Hva er metadata? 

Metadata er “data om data”. Det betyr at metadata gir beskrivelser eller informasjon om et objekt, en enhet, en variabel eller et datapunkt. Hensikten med metadata er å beskrive eller annotere de tilhørende dataene, slik at de blir maskinlesbare.  

Eksempler på metadata 

Metadata finnes overalt i hverdagen. Hvis vi ser på den siste samtalen vi hadde på mobilen, finner vi informasjon om når samtalen fant sted, hvor lenge den varte og om hvem vi ringte til. Dette er metadata om telefonsamtalen. Selv om vi ikke har tatt opp selve samtalen, kan metadataene gi oss mye informasjon.  

Metadata kan også fungere som data, avhengig av hva de brukes til. For eksempel, hvis noen studerer hvor lenge en telefonsamtale varer i gjennomsnitt, kan dataene som sier noe om samtalen vår brukes som data i prosjektet.  

Hva er ulike typer metadata? 

Det er flere ulike typer metadata. Hovedsakelig kan vi skille mellom følgende:

  • Administrative metadata – dette er informasjon om prosjektet som er relevant for å kunne administrere det (f.eks. informasjon om prosjektets lisenser og tilgangsrettigheter) 

  • Beskrivende data eller siteringsdata – dette er informasjon som gjør at andre kan finne datasettet (f.eks. datasettets forfatter, tittel og emneord) 

  • Strukturelle metadata – dette er data om hvordan datasettet er strukturert internt (f.eks. navn på datasettets variabler) 

Hvordan lager jeg metadata til prosjektet mitt?  

For å lage grunnleggende metadata til prosjektet ditt eller et enkelt datasett, kan du følge femten av metadataenes såkalte "kjerneelementer" , som er utviklet av Dublin Core Metadata Initiative (DCMI). Det er et globalt tiltak, som ønsker å formelt standardisere metadataterminologi. Kjerneelementene inkluderer termer, som f.eks. «tittel» (= spesifisering av tittel på datasettet eller en kilde), «tema» (= spesifisering av kildens hovedtema) eller «beskrivelse» (= spesifisering av kildens innhold).    

Hvordan finner jeg fagspesifikke metadatastandarder? 

Foruten disse kjerneelementene vil ulike fagfelt ha sine ulike standarder for å lage og strukturere metadata. Det er lurt å bli kjent med de eksisterende spesifikke standardene for metadata (f.eks. RDA database for metadata standards) før du lager metadata til ditt eget prosjekt.  

Mer informasjon

Dokumentasjon

Hva er dokumentasjon? 

En klar og systematisk dokumentasjon hever kvaliteten i forskningen. I tillegg til å lage metadata er det derfor viktig å kunne dokumentere arbeidsflyten i prosjektet, samt hvordan prosjektdataene håndteres. 

Eksempler på dokumentasjon 

Et eksempel på dokumentasjon er å lage en tekstfil i mappen med rådata, som sier «Alle datafiler i denne oversikten er rådatafiler, som ikke skal endres på. For behandlede eller redigerte data, gå til data/behandlet oversikt». På denne måten gir du instrukser til andre og til deg selv om hvilke data som ligger hvor, og om hvordan disse skal håndteres. Sikkerhetskopiering av notater om studien eller prosjektets status (f.eks. notatbøker fra lab eller feltjournaler) er også å anse som dokumentasjon.      

Hvilke typer dokumentasjon finnes?

Vi kan dokumentere bade studien (dokumentasjon på prosjektnivå) og selve dataene (dokumentasjon på datanivå). 

  • Dokumentasjon på prosjektnivå forklarer målet med studien, hva som er forskningens spørsmål/hypoteser, hvilke metodologier som brukes, hvilke instrumenter og målenheter som er brukt, osv. 
  • Dokumentasjon på datanivå, eller objektnivå gir informasjon om individuelle objekter, som for eksempel bilder eller variabler i et datasett / en tabell, eller en transkripsjon, osv. 

Hvordan lager jeg dokumentasjon for prosjektet mitt?  

En måte å lage en systematisk dokumentasjon for forskningen og dataene på, er å bruke README.txt-filer 

README.txt-filer er enkle tekstfiler, som kan informere om alle elementer (eller arbeidsflyt eller prosesser disse elementene er en del av) i en og samme innholdsfortegnelse. Med andre ord fungerer README.txt-filer som et oversiktskart over filene. 

README.txt-filer gir instrukser både til andre og til ditt «fremtidige jeg», for eksempel når du vil gjenbruke dataene dine eller foreta nye dataanalyser.  

Hvis du trenger veiledning i å bruke README.txt-filer, kan du se til denne: guide to start creating README.txt files

*Merk at noe av informasjonen som legges inn i disse filene overlapper med administrative og/eller beskrivende metadata (metadata er også dokumentasjon!). 

Et annet viktig aspekt ved dokumentasjon er versjonskontroll. Ved å kontrollere versjonen av hver datatransformasjon eller hver oppdatering av et prosjektdokument, kan du enkelt spore (og spore tilbake til!) enhver endring. En enkel strategi for versjonskontroll er å skrive versjonsnummeret i filnavnet (f.eks. «Manuskript_utkast_V1» eller «Behandlet_datasett_V1») og oppdatere når det er nødvendig. Det finnes også andre mer automatiserte måter å utføre versjonskontroll på, for eksempel Git.  

Mer informasjon finner du her:

Lurer du på noe?

Send gjerne en epost til: research-data@uio.no 

 

Emneord: data, metadata, Dokumentasjon
Publisert 16. juni 2022 08:22 - Sist endret 12. apr. 2023 10:07