R-hjelp til exercise 3.3 i BSS

 

 

# Les dataene inn i en dataramme, gi navn til variablene i datarammen og se p? dataene:

firms<-read.table("http://www.math.uio.no/avdc/kurs/STK4900/data/exer3_3.dat")

names(firms)<-c("mnd","size","type")

firms

 

# Kontroller at dataene svarer til de som er gitt i oppgaven.

# (merk at "mutual" er kodet som 0 og "stock" som 1)

 

 

# Gj?r variablene i datarammen tilgjengelige:

attach(firms)

 

 

# Beregn ulike summariske m?l for variablene:

summary(firms)

 

# Pass p? at du forst?r hva de summariske m?lene sier deg!

 

 

# Lag plott (ved siden av hverandre) av "mnd" mot hver av de to andre variablene.

# For den numeriske kovariaten "size" lager vi et spredningsplott, mens vi lager boksplott

# for den kategoriske kovariaten "type":

par(mfrow=c(1,2))

plot(size,mnd)

boxplot(mnd~type)

par(mfrow=c(1,1))

 

# Hva ser du av plottene?

 

 

# Gj?r innledende regresjonsanalyser med hver variabel for seg:

fit1<-lm(mnd~size)

fit2<-lm(mnd~type)

summary(fit1)

summary(fit2)

 

# Hvilken variabel forklarer alene mest av variasjonen i bel?pene?

# Har variablene (alene) signifikant betydning?

# I den siste regresjonsmodellen har vi bare ?n kategorisk kovariat.

# Kunne vi testet effekten av den p? en annen m?te? Ville det gitt noen forskjell?

 

 

# Gj?r regresjonsanalyse med begge kovariatene samtidig:

fit3<-lm(mnd~size+type)

summary(fit3)

 

# Hva sier denne modellen deg? Ser den bedre ut en den beste modellen med bare ?n kovariat?

 

 

# Pr?v selv med modeller med andregrads ledd for size og/eller med interaksjon.