Start-hjelp for datasettene til ukesoppgavene i R

Hvordan komme i gang med datasett fra boka i R eller RStudio?

Før vi kan begynne med en gitt oppgave, må vi en gang for alle laste ned datasettene som en zippet mappe:

  1. Klikk deg inn på bokas hjemmeside
  2. Under overskriften ‘CSV Data Sets’, klikk på lenka ‘CSV Data Sets’, så blir en komprimert fil kalt ‘ips10e_csv_data_sets’ lastet ned på din maskin
  3. Herfra blir videre fremgangsmåte litt forskjellig for Mac og Windows
  • Mac: 
    • Gå til mappen på din maskin der ‘ips10e_csv_data_sets.zip’ ligger (dette kan være feks på ‘~/Downloads/’), og herfra klikk på mappa så den blir pakket ut. Du får da en mappe som heter ‘ips10e_csv_data_sets’, i samme mappe der du hadde ‘ips10e_csv_data_sets.zip’.
    • Mappa ‘ips10e_csv_data_sets’ innenfor den ytre ‘ips10e_csv_data_sets’ inneholder en undermappe for hvert kapittel, for eksempel inneholder undermappa ‘ips10e_ch1_csv_data_sets’ datasettene til oppgavene i kapittel 1.
    • Dersom zip-fila ble lasta ned til ‘~/Downloads/’, ligger da datasettene til oppgavene i kapittel 1 i mappa ‘~/Downloads/ips10e_csv_data_sets/ips10e_csv_data_sets/ips10e_ch1_csv_data_sets’. Eksempelvis ligger da datasettet til oppgave 1.15 på '~/Downloads/ips10e_csv_data_sets/ips10e_csv_data_sets/ips10e_ch1_csv_data_sets/ex01-015KPOT40.csv'
      • I RStudio kan nå datasettet til oppgave 1.15 nå leses inn med kommandoen data=read.csv("~/Downloads/ips10e_csv_data_sets/ips10e_csv_data_sets/ips10e_ch1_csv_data_sets/ex01-015KPOT40.csv")

        Variabelen `data` er nå en `data.frame` som inneholder flere kolonner med informasjon. Dersom du i oppgave 1.15 kun er interessert i variabelen `Potassium_mg` så kan du hente ut denne til variabelen x med kommandoen

        x = data$Potassium_mg

  • Windows
    • Gå til mappa på din maskin der den komprimerte fila ‘ips10e_csv_data_sets.zip’ ligger. (Dette kan feks være på  'C:\Users\brukernavn\Downloads', der 'brukernavn' byttes med ditt brukernavn.) Høyre-klikk på 'csv.zip' og velg 'Pakk ut alle...' (eller et lignende valg for å pakke ut). Hvis du ikke angir noe annet, blir det nå laget en ny mappe 'ips10e_csv_data_sets' på det samme området som fila 'ips10e_csv_data_sets.zip' ligger.
    • Mappa ‘ips10e_csv_data_sets’ innenfor den ytre ‘ips10e_csv_data_sets’ inneholder en undermappe for hvert kapittel, for eksempel inneholder undermappa ‘ips10e_ch1_csv_data_sets’ datasettene til oppgavene i kapittel 1.
    • Dersom den zip-fila ble lasta ned til ‘C:\Users\brukernavn\Downloads’, ligger da datasettene til oppgavene i kapittel 1 i mappa ‘C:\Users\brukernavn\Downloads\ips10e_csv_data_sets\ips10e_csv_data_sets\ips10e_ch1_csv_data_sets’. Eksempelvis ligger da datasettet til oppgave 1.15 på 'C:\Users\brukernavn\Downloads’, ligger da datasettene til oppgavene i kapittel 1 i mappa ‘C:\Users\brukernavn\Downloads\ips10e_csv_data_sets\ips10e_csv_data_sets\ips10e_ch1_csv_data_sets\ex01-015KPOT40.csv'
      • Jeg kan nå lese inn datasettet i RStudio til oppgave 1.15 med kommandoen data=read.csv("C:\Users\brukernavn\Downloads\ips10e_csv_data_sets\ips10e_csv_data_sets\ips10e_ch1_csv_data_sets\ex01-015KPOT40.csv").

        Variabelen `data` er nå en `data.frame` som inneholder flere kolonner med informasjon. Dersom du i oppgave 1.15 kun er interessert i variabelen `Potassium_mg` så kan du hente ut denne til variabelen x med kommandoen

        x = data$Potassium_mg

      • Du kan finne csv-fila til en oppgave i Filutforskeren og bruke 'Ctrl V' for å kopiere filstien dens fra adresselinja i Filutforskeren til R-kommandoen i R-skriptet ditt.
  • Uavhengig av operativsystem: Om du ønsker, flytt mappa 'ips10e_csv_data_sets' (gjerne den innerste dersom du også fikk to mapper med samme navn innenfor hverandre) til en annen lokasjon der du ønsker å ha den lagra. Du kan feks legge den inni en STK1000-mappe på skrivebordet, eller et annet sted på datamaskinen der du finner den igjen (viktig!). Det kan være lurt å ha datasettene og R-skriptene dine i en felles mappestruktur. Spør gjerne gruppelærerne om hjelp når og hver gang du er usikker. Øvelse gjør mester!
Publisert 5. sep. 2021 15:33 - Sist endret 5. sep. 2021 15:36