R-hjelp til exercise 3.2 i BSS

 

 

# Les dataene inn i en dataramme, gi navn til variablene i datarammen og se p? dataene:

forsikring<-read.table("http://www.math.uio.no/avdc/kurs/STK4900/data/exer3_2.dat")

names(forsikring)<-c("inntekt","riskave","belop")

forsikring

 

# Kontroller at dataene svarer til de som er gitt i oppgaven.

 

 

# Gj?r variablene i datarammen tilgjengelige:

attach(forsikring)

 

 

# Beregn ulike summariske m?l for variablene:

summary(forsikring)

 

# Pass p? at du forst?r hva de summariske m?lene sier deg!

 

 

# Lag plott (ved siden av hverandre) av "belop" mot hver av de to andre variablene:

par(mfrow=c(1,2))

plot(inntekt,belop)

plot(riskave,belop)

par(mfrow=c(1,1))

 

# Hva ser du av plottene?

 

 

# Beregn korrelasjonen mellom variablene:

cor(forsikring)

 

# Hvordan stemmer korrelasjonene med det du s? av plottene?

 

 

# Gj?r innledende regresjonsanalyser med hver variabel for seg:

fit1<-lm(belop~inntekt)

fit2<-lm(belop~riskave)

summary(fit1)

summary(fit2)

 

# Hvilken variabel forklarer alene mest av variasjonen i bel?pene?

# Har variablene (alene) signifikant betydning?

 

 

# Gj?r regresjonsanalyse med begge kovariatene samtidig:

fit3<-lm(belop~inntekt+riskave)

summary(fit3)

 

# Hva sier denne modellen deg? Ser den bedre ut en den beste modellen med bare ?n kovariat?

 

 

# Pr?v selv med modeller med andregrads ledd og interaksjon.

# Du f?r en modell med andregrads ledd for begge kovariatene og interaksjon ved kommandoen

fit4<-lm(belop~inntekt+riskave+I(inntekt^2)+I(riskave^2)+riskave*inntekt)