English version of this page

Dataorganisering

God organisering av data fører til bedre effektivisering og reproduserbarhet.  

En god organisering av forskningsprosjektet gjør at man sparer tid, øker sjansen for reproduserbarhet og gjør det enklere å dele data.    

Hvordan forskningsprosjektet skal organiseres avhenger av ulike faktorer. God organisering kjennetegnes bl.a. ved:  

  • En gjennomtenkt mappestruktur der det er enkelt å finne filer 

  • Bærekraftige filformater som har varighet og kan benyttes uavhengig av spesifikke programvarer 

  • Prosjektet benytter seg av navnekonvensjoner for filer, som i sin tur gjør filene forståelige 

  • Detaljert informasjon om datainnsamlingen og prosesseringsprosedyrer (se Metadata og dokumentasjon) 

  • En README-fil eller lignende som beskriver organiseringen (se Metadata og dokumentasjon)  

Mappestruktur 

Det er viktig å strukturere dataene i mapper, slik at det blir enklere å lokalisere og organisere filene, og man har bedre kontroll på ulike versjoner av filer. En gjennomtenkt mappestruktur er spesielt viktig i tilfeller der man samarbeider med andre. Mappestrukturen har stor innvirkning på hvordan filene kan prosesseres og analyseres. Straks en struktur fylles med data kan det være både tungvint og tidkrevende å endre på noe. Her er noen tips: 

  • Ikke bruk desktop som lagringsplass 

  • Lag et mappehierarki og bruk beskrivende mappenavn 

  • Unngå å lage for generelle mapper, og lag heller flere undermappper 

  • Lag en struktur og hold deg til den 

  • Tenk systematisk, logisk og klart før du begynner (!) 

  • Det skal være raskt og effektivt å navigere 

  • Det skal være enkelt å bruke til enhver tid 

  • Skalerbar struktur 

  • Hold aktive data fraskilt fra ferdige data 

  • Foreta en opprydning med jevne mellomrom 

Du kan finne et eksempel på en systematisk, enkel og skalerbar mappestruktur på nettsidene til CodeRefinery. Et annet nedlastbart eksempel finnes her.  

Filformater

På et tidlig tidspunkt i forskningsprosessen er det spesielt viktig å tenke på hvilket filformat du skal bruke på dataene dine. En viktig del av prosjektets metadata og dokumentasjon kan skrives inn i datafilen. Et eksempel er når du tar et bilde med mobiltelefonen og informasjon om dato og tidspunkt følger med bildefilen (dvs. metadata). Denne type informasjon kan fremme dataanalyse, dokumentasjon, og reproduserbarhet.  

For å sikre at dataene er tilgjengelige i et langtidsperspektiv, er det en god idé å lagre dataene (eller kopier av disse) i bærekraftige filformat. En plain text-fil (.txt) er mer bærekraftig enn en Microsoft Word-fil (.docx), ettersom den første er åpen, ikke produsenteid og ofte brukt.  

Her kan du finne mer informasjon om bærekraftige filformater:  

Navnekonvensjoner for filer

En filnavnkonvensjon er regler for hvordan filer skal navngis i forskningsprosjektet ditt. Det er tidsbesparende å bruke når man skal finne igjen spesifikke filer. I tillegg gjør det det enklere å gjenbruke og reprodusere filen.  

Her er oversikt over noe du kan inkludere i et filnavn:  

  • Dato og tidspunkt som er relevante for filens innhold 

  • Navn på prosjekt eller eksperiment 

  • Versjonsnummer på filen 

  • Kort informasjon om innholdet i filen 

  • Navn eller initialer på forsker 

  • Unik identifikator som nummer på eksperiment eller en serie 

Når du gir navn til en fil, er det best praksis å:  

  • Bruke korte og beskrivende navn 

  • Gi generell informasjon før mer spesifikke detaljer  

  • Bruke understrek for å skille ord 

  • Skrive dato baklengs (ÅÅÅÅMMDD) – ISO 8601 standard 

  • Skrive nummer med likt antall tall:  

  • Skriv 01, ikke 1, hvis tallene går lengre enn til 10 

  • Skriv 0001, ikke 1, hvis tallene går lengre enn til 1000 

  • Skrive versjonsnummer til slutt 

  • Unngå bruk av spesielle tegn:  

  • #, %, &, \ , / , ‘ , “ , !, $ , > , < , { , } , * , ?, =  

  • IKKE bruke mellomrom i filnavn 

  • IKKE la navnet begynne eller slutte med mellomrom, punktum, bindestrek, eller understrek 

  • Alltid bruke små bokstaver (de fleste systemer er sensitive for store og små bokstaver

Lurer du på noe?

Send gjerne en epost til: research-data@uio.no 

 

 

Emneord: data, organisering, filnavn, filstruktur, mappestruktur
Publisert 16. juni 2022 08:21 - Sist endret 12. apr. 2023 10:06