R-hjelp
til exercise 3.2 i BSS
#
Les dataene inn i en dataramme, gi navn
til variablene i datarammen og se p? dataene:
forsikring<-read.table("http://www.math.uio.no/avdc/kurs/STK4900/data/exer3_2.dat")
names(forsikring)<-c("inntekt","riskave","belop")
forsikring
# Kontroller at dataene svarer til de som er
gitt i oppgaven.
#
Gj?r variablene i datarammen tilgjengelige:
attach(forsikring)
#
Beregn ulike summariske m?l for variablene:
summary(forsikring)
#
Pass p? at du forst?r hva de summariske m?lene sier deg!
#
Lag plott (ved siden av hverandre)
av "belop" mot hver av de to andre variablene:
par(mfrow=c(1,2))
plot(inntekt,belop)
plot(riskave,belop)
par(mfrow=c(1,1))
# Hva ser du av plottene?
#
Beregn korrelasjonen mellom variablene:
cor(forsikring)
# Hvordan stemmer korrelasjonene med det du s? av
plottene?
#
Gj?r innledende regresjonsanalyser med hver variabel for seg:
fit1<-lm(belop~inntekt)
fit2<-lm(belop~riskave)
summary(fit1)
summary(fit2)
# Hvilken variabel forklarer alene mest av
variasjonen i bel?pene?
# Har variablene (alene) signifikant betydning?
#
Gj?r regresjonsanalyse med begge kovariatene samtidig:
fit3<-lm(belop~inntekt+riskave)
summary(fit3)
#
Hva sier denne modellen deg? Ser den bedre ut en den beste modellen med bare ?n kovariat?
#
Pr?v selv med modeller med andregrads ledd og interaksjon.
#
Du f?r en modell med andregrads ledd for begge kovariatene og
interaksjon ved kommandoen
fit4<-lm(belop~inntekt+riskave+I(inntekt^2)+I(riskave^2)+riskave*inntekt)