R-hjelp til exercise 5 i BSS

 

 

# PUNKT a)

 

# Les dataene inn i en dataramme, gi navn til variablene i datarammen og se p? dataene:

salinity<-read.table("http://www.math.uio.no/avdc/kurs/STK4900/data/exer5.dat")

names(salinity)<-c("salt","saltprev","trend","vannforing")

salinity

 

# Kontroller at dataene svarer til de som er gitt i oppgaven.

 

 

# F? en oversikt over dataene

summary(salinity)

plot(salinity)

 

# Pass p? at du forst?r hva de summariske m?lene sier deg!

# Hva ser du av spredningsplottene?

 

 

# Gj?r variablene i datarammen tilgjengelige

attach(salinity)

 

# Gj?r en line?r regresjon p? dataene med alle tre kovariater og se p? resultatene:

lmfull<-lm(salt~saltprev+trend+vannforing)

summary(lmfull)

 

# Hvilken betydning har de ulike kovariatene?

# Hvordan stemmer det med spredingsplottene?

 

 

# PUNKT b)

 

# Beregn tilpassede verdier og residualer:

saltfit<-lmfull$fit

saltres<-salt-saltfit

summary(saltres)

 

# Du f?r residualene direkte ved "lmfull$res". Sjekk at det stemmer

summary(lmfull$res)

 

# Summen av residualene er null, s? mindre avvik for gjennomsnittet skyldes avrunding

 

 

# PUNKT c)

 

# Vi lager ulike plott av residualene:

 

# Histogram og Q-Q plott (lag ett plott om gangen)

hist(lmfull$res)

qqnorm(lmfull$res)

 

# Hva sier plottene deg?

 

 

# Residualer mot tilpassede verdier:

plot(lmfull$fit, lmfull$res, xlab="Fitted values", ylab="Residuals")

 

# Hva sier plottet deg?

 

 

# Residualer mot hver av kovariatene (lag ett plott om gangen):

plot(saltprev, lmfull$res, ylab="Residuals")

plot(trend, lmfull$res, ylab="Residuals")

plot(vannforing, lmfull$res, ylab="Residuals")

 

# Hva sier plottene deg?

# Er det tegn p? noen avvik fra linearitet?

 

 

# Residualer mot observasjonsnummer

# (det er ikke oppgitt om dataene er tatt i rekkef?lge, noe en vil vite i en virkelig studie)

plot(lmfull$res,type="l", xlab="obs.nummer", ylab="residuals")

 

# Hva sier plottet deg?

# Kan du se noen tegn til autokorrelasjon?

 

 

# Det fins flere andre nyttige plott av residualene.

# Du f?r en rekke plott (noen av de over, og noen andre) ved kommandoen

# (kommandoen kan gi 6 ulike plott -- vi viser de 4 f?rste av dem)

par(mfrow=c(2,2))

plot(lmfull, 1:4)

par(mfrow=c(1,1))

 

# Pr?v ? forst? hva disse plottene sier deg.

 

 

 

# PUNKT d)

 

# Tilpasser modell uten "trend" (hvorfor?):

 

lmred1<-lm(salt~saltprev+vannforing)

summary(lmred1)

 

# Hvordan er denne modellen i forhold til den som ogs? har med "trend"

 

 

# Pr?v selv andre modeller (f.eks med andregrads ledd for vannforing)

# Hvilken modell ender du opp med?