En kort introduksjon til R

 

Form�let med denne lille innf�ringen er � gi en liten introduksjon til R

 

Du kan kan kopiere kommandoene nedenfor fra web-leseren og lime dem inn i kommandovinduet til R.

Alt p� en linje som kommer etter # er en kommentar, og R hopper over dette

 

 

# R som kalkulator

 

# Du kan bruke R som en kalkulator. For eksempel:

3+2

3-2

3*2

3/2

3^2

sqrt(2)

exp(2)

log(2)

 

 

#Skalare variable

 

# Du kan definere skalare variable og regne med dem. For eksempel:

a <- 2�� # alternativt a=10

b <- 3�� # alternativt b=20

a+b

a*b

a^b

 

 

#Vektorer

 

# Du kan definere vektorer og regne med dem. For eksempel:

x <- c(1,2,3,4)

y <-c(2,4,6,8)

x+y

y-x

y/x

y^x

 

# Merk at R regner elementvis

# (R kan ogs� utf�re vektor og matrise algebra)

 

# Du kan "trekke ut" ett eller flere elementer av en vektor:

x[2]

y[c(1,3)]

 

 

#Sekvenser

 

# R kan lage spesielle sekvenser (lagret som vektorer):

c <- 1:10

c

d <- seq(0,20,2)

d

f <- rep(1,10)

f

 

#Funksjoner av en vektor

 

# R har en rekke funksjoner som opererer p� vektorer. For eksempel:

sum(x)

prod(x)

length(x)

 

 

 

#Enkel beskrivende statistikk

 

# Lagrer dataene i tabell 1 p� side 1 i BS i en tabell:

rock.age<-c(249,254,243,268,253,269,287,241,273,306,303,280,260,256,278,344,304,283,310)

 

# Beregner gjennomsnitt, median og standardavvik:

mean(rock.age)

median(rock.age)

sd(rock.age)

 

# Kommandoen "summary" gir et sammmendrag:

summary(rock.age)

 

 

#Innlesing av data og datarammer

 

# Vi kan lese data fra en file (eventuelt p� web) inn i en dataramme. For eksempel:

sigarett<-read.table("http://www.uio.no/studier/emner/matnat/math/STK4900/v07/annet/sigaretter.dat", header=T)

 

#Se p� dataene og skriv ut et sammendrag av dem:

sigarett

 

 

# Du kan adressere variablene i en dataramme ved f.eks

sigarett$nicot����� #merk at det ikke holde skrive "nicot"

 

#Du kan tilknytte datarammen

attach(sigarett)

 

#N� er det nok skrive "nicot"

 

 

#Noen plot

 

# R kan lage en rekke nyttige plott.

hist(nicot)��������� ��������� # histogram

boxplot(nicot)������������ # boksplott

qqnorm(nicot)������������ # normalfordelingsplott

 

# Flere plott p� samme figur:

par(mfrow=c(1,2)) ���� # to plott ved siden av hverandre

plot(co, nicot)������������� # spredingsplott

plot(tar, nicot)

par(mfrow=c(1,1))�� �� # stiller tilbake igjen til ett plott

 

 

# Noen statistiske metoder

 

# t-test og konfidensintervall:

t.test(rock.age)

 

#Wilcoxon test and konfidensintervall:

wilcox.test(rock.age, conf.int=T)     

 

# Line�r regresjon:

fit<-lm(nicot~co+tar)

summary(fit)

 

# Merk at "summary" avhenger av hva slags objekt kommandoen brukes p�. Det er typisk for R.

 

 

# Hjelpefunksjoner

 

# R har et godt utbygget hjelpesystem som beskriver kommandoene. For eksempel:

help(lm)

 

# Hvis du ikke hadde kjent navnet kommandoen for line�r regresjon, kunne du ha gitt kommandoen:

help.search("linear regression")

 

 

# Utlogging og lagring av "workspace"

 

# Du avslutter R med kommandoen

q()

 

#Du blir spurt"Save workspace image?". Hvis du svarer ja p� dette, tar R vare p� alle variable for neste R-sesjon

 

 

# Oppsett av R

 

# Hvis du bruker R til arbeide med flere prosjekter, er det lurt ha en mappe for hvert prosjekt.

# For STK4900, lager du en mappe som heter STK4900.

# I denne mappen lime du inn et "shortcut" av R-ikonet.

# Du h�yreklikker s� p� ikonet, og skriver "C:\Documents and Settings\brukernavn\My Documents\STK4900" i feltet "Start in"

# N� vil alle R-eregninger i STK4900 bli lagret i mappen STK 4900, og dermed holdt adskilt fra andre R-beregninger