Del 1

Vi skal lage et lite datasett som inneholder data for fire personer, som angir deres respons til en behandling. 

Oppgave 1

Lag en variabel som inneholder tallene 1-4 i stigende rekkefølge, vha seq-funksjonen. Kall variablen ID.

Oppgave 2

Lag en variabel som inneholder tallene 2,2,1,1 i denne rekkefølgen, vha rep-funksjonen. Kall variablen gruppe.

Oppgave 3

Lag en variabel som heter respons, der mulige kategorier er dårlig, middels og god. Du kan fordele respons på de fire deltakerne som du selv vil. Husk at denne variablen bør endres til å være en ordnet faktor.

Oppgave 4

Sett alle variabler sammen til et datasett (data frame). Du kan kalle datasettet for pasientData

Oppgave 5

Skriv ut case nr 2, deretter variabel 3, og til slutt verdien til variabel nr 3 for case nr 2.

Oppgave 6

Skriv ut alle caser bortsett fra case nr 1.

Del 2

Oppgave 1

Basert på den informasjonen du kan få fra str(data$variabel) og summary(data$variabel), kan du finne ut hvilke år du har data fra?

Oppgave 2

Hva skjer om du kombinerer summary-funksjonen med as.factor(data$variabel) for årstall-variablen? Endrer dette selve datasettet?

Del 3

Oppgave 1

Lag en ny variabel som heter gdpPercap1000, som angir BNP (GDP) per innbygger i 1000 USD istedenfor i USD.

Oppgave 2

Regn ut gjennomsnittlig populasjon for 2007 gruppert etter levestandardkategoriene i lifeCat, og tell opp antall land du har i hver av kategoriene (hint: n()).

Oppgave 3

Lag et datasett som kun har dataene fra Argentina, for alle år, ved å velge bare de dataene som har country==“Argentina”. Kall settet gpArgentina.

Del 4

Oppgave 1

Lag en tabell over kategorisk forventet levealder mot kontinent, som viser prosentvis fordeling istedenfor desimaltall.

Oppgave 2

Funksjonen prop.table har et ekstra argument, margin, som kan ta verdier NULL, 1 og 2, der NULL er default. Hva skjer om du setter margin = 1 eller 2 inni prop.table? Det kan være lettere å se om du legger på addmargins() rundt hele kommandoen.