R-hjelp
til exercise 3.2 i BSS
#
Les dataene inn i en dataramme, gi navn
til variablene i datarammen og se p� dataene:
forsikring<-read.table("http://www.math.uio.no/avdc/kurs/STK4900/data/exer3_2.dat")
names(forsikring)<-c("inntekt","riskave","belop")
forsikring
# Kontroller at dataene svarer til de som er
gitt i oppgaven.
#
Gj�r variablene i datarammen tilgjengelige:
attach(forsikring)
#
Beregn ulike summariske m�l for variablene:
summary(forsikring)
#
Pass p� at du forst�r hva de summariske m�lene sier deg!
#
Lag plott (ved siden av hverandre)
av "belop" mot hver av de to andre variablene:
par(mfrow=c(1,2))
plot(inntekt,belop)
plot(riskave,belop)
par(mfrow=c(1,1))
# Hva ser du av plottene?
#
Beregn korrelasjonen mellom variablene:
cor(forsikring)
# Hvordan stemmer korrelasjonene med det du s� av
plottene?
#
Gj�r innledende regresjonsanalyser med hver variabel for seg:
fit1<-lm(belop~inntekt)
fit2<-lm(belop~riskave)
summary(fit1)
summary(fit2)
# Hvilken variabel forklarer alene mest av
variasjonen i bel�pene?
# Har variablene (alene) signifikant betydning?
#
Gj�r regresjonsanalyse med begge kovariatene samtidig:
fit3<-lm(belop~inntekt+riskave)
summary(fit3)
#
Hva sier denne modellen deg? Ser den bedre ut en den beste modellen med bare �n kovariat?
#
Pr�v selv med modeller med andregrads ledd og interaksjon.
#
Du f�r en modell med andregrads ledd for begge kovariatene og
interaksjon ved kommandoen
fit4<-lm(belop~inntekt+riskave+I(inntekt^2)+I(riskave^2)+riskave*inntekt)