Metadata
Hva er metadata?
Metadata er “data om data”. Det betyr at metadata gir beskrivelser eller informasjon om et objekt, en enhet, en variabel eller et datapunkt. Hensikten med metadata er å beskrive eller annotere de tilhørende dataene, slik at de blir maskinlesbare.
Eksempler på metadata
Metadata finnes overalt i hverdagen. Hvis vi ser på den siste samtalen vi hadde på mobilen, finner vi informasjon om når samtalen fant sted, hvor lenge den varte og om hvem vi ringte til. Dette er metadata om telefonsamtalen. Selv om vi ikke har tatt opp selve samtalen, kan metadataene gi oss mye informasjon.
Metadata kan også fungere som data, avhengig av hva de brukes til. For eksempel, hvis noen studerer hvor lenge en telefonsamtale varer i gjennomsnitt, kan dataene som sier noe om samtalen vår brukes som data i prosjektet.
Hva er ulike typer metadata?
Det er flere ulike typer metadata. Hovedsakelig kan vi skille mellom følgende:
-
Administrative metadata – dette er informasjon om prosjektet som er relevant for å kunne administrere det (f.eks. informasjon om prosjektets lisenser og tilgangsrettigheter)
-
Beskrivende data eller siteringsdata – dette er informasjon som gjør at andre kan finne datasettet (f.eks. datasettets forfatter, tittel og emneord)
-
Strukturelle metadata – dette er data om hvordan datasettet er strukturert internt (f.eks. navn på datasettets variabler)
Hvordan lager jeg metadata til prosjektet mitt?
For å lage grunnleggende metadata til prosjektet ditt eller et enkelt datasett, kan du følge femten av metadataenes såkalte "kjerneelementer" , som er utviklet av Dublin Core Metadata Initiative (DCMI). Det er et globalt tiltak, som ønsker å formelt standardisere metadataterminologi. Kjerneelementene inkluderer termer, som f.eks. «tittel» (= spesifisering av tittel på datasettet eller en kilde), «tema» (= spesifisering av kildens hovedtema) eller «beskrivelse» (= spesifisering av kildens innhold).
Hvordan finner jeg fagspesifikke metadatastandarder?
Foruten disse kjerneelementene vil ulike fagfelt ha sine ulike standarder for å lage og strukturere metadata. Det er lurt å bli kjent med de eksisterende spesifikke standardene for metadata (f.eks. RDA database for metadata standards) før du lager metadata til ditt eget prosjekt.
Mer informasjon
-
Collection of tips and guidences hvordan etterkomme FAIR-prinsippene i praksis.
-
Nadkarni, P.M. (2011). What Is Metadata?. In: Metadata-driven Software Systems in Biomedicine. Health Informatics. Springer, London. https://doi-org.ezproxy.uio.no/10.1007/978-0-85729-510-1_1. Spør en fagbibliotekar om tilgang.
-
Riley, J. (2017). Understanding Metadata: What is Metadata, and What is it For?: A Primer. National Information Standards Organization, Baltimore. https://www.niso.org/publications/understanding-metadata-2017.
-
Overview of the Elements i Dublin Core Metadata Standard
-
Research Data Alliance Database for Metadata Standards
Dokumentasjon
Hva er dokumentasjon?
En klar og systematisk dokumentasjon hever kvaliteten i forskningen. I tillegg til å lage metadata er det derfor viktig å kunne dokumentere arbeidsflyten i prosjektet, samt hvordan prosjektdataene håndteres.
Eksempler på dokumentasjon
Et eksempel på dokumentasjon er å lage en tekstfil i mappen med rådata, som sier «Alle datafiler i denne oversikten er rådatafiler, som ikke skal endres på. For behandlede eller redigerte data, gå til data/behandlet oversikt». På denne måten gir du instrukser til andre og til deg selv om hvilke data som ligger hvor, og om hvordan disse skal håndteres. Sikkerhetskopiering av notater om studien eller prosjektets status (f.eks. notatbøker fra lab eller feltjournaler) er også å anse som dokumentasjon.
Hvilke typer dokumentasjon finnes?
Vi kan dokumentere bade studien (dokumentasjon på prosjektnivå) og selve dataene (dokumentasjon på datanivå).
- Dokumentasjon på prosjektnivå forklarer målet med studien, hva som er forskningens spørsmål/hypoteser, hvilke metodologier som brukes, hvilke instrumenter og målenheter som er brukt, osv.
-
Dokumentasjon på datanivå, eller objektnivå gir informasjon om individuelle objekter, som for eksempel bilder eller variabler i et datasett / en tabell, eller en transkripsjon, osv.
Hvordan lager jeg dokumentasjon for prosjektet mitt?
En måte å lage en systematisk dokumentasjon for forskningen og dataene på, er å bruke README.txt-filer
README.txt-filer er enkle tekstfiler, som kan informere om alle elementer (eller arbeidsflyt eller prosesser disse elementene er en del av) i en og samme innholdsfortegnelse. Med andre ord fungerer README.txt-filer som et oversiktskart over filene.
README.txt-filer gir instrukser både til andre og til ditt «fremtidige jeg», for eksempel når du vil gjenbruke dataene dine eller foreta nye dataanalyser.
Hvis du trenger veiledning i å bruke README.txt-filer, kan du se til denne: guide to start creating README.txt files.
*Merk at noe av informasjonen som legges inn i disse filene overlapper med administrative og/eller beskrivende metadata (metadata er også dokumentasjon!).
Et annet viktig aspekt ved dokumentasjon er versjonskontroll. Ved å kontrollere versjonen av hver datatransformasjon eller hver oppdatering av et prosjektdokument, kan du enkelt spore (og spore tilbake til!) enhver endring. En enkel strategi for versjonskontroll er å skrive versjonsnummeret i filnavnet (f.eks. «Manuskript_utkast_V1» eller «Behandlet_datasett_V1») og oppdatere når det er nødvendig. Det finnes også andre mer automatiserte måter å utføre versjonskontroll på, for eksempel Git.
Mer informasjon finner du her:
Lurer du på noe?
Send gjerne en epost til: research-data@uio.no