R-hjelp
til exercise 3.3 i BSS
#
Les dataene inn i en dataramme, gi navn
til variablene i datarammen og se p? dataene:
firms<-read.table("http://www.math.uio.no/avdc/kurs/STK4900/data/exer3_3.dat")
names(firms)<-c("mnd","size","type")
firms
# Kontroller at dataene svarer til de som er
gitt i oppgaven.
#
(merk at "mutual" er
kodet som 0 og "stock" som 1)
#
Gj?r variablene i datarammen tilgjengelige:
attach(firms)
#
Beregn ulike summariske m?l for variablene:
summary(firms)
#
Pass p? at du forst?r hva de summariske m?lene sier deg!
#
Lag plott (ved siden av hverandre)
av "mnd" mot hver av de to andre variablene.
#
For den numeriske kovariaten "size" lager vi et spredningsplott,
mens vi lager boksplott
#
for den kategoriske kovariaten "type":
par(mfrow=c(1,2))
plot(size,mnd)
boxplot(mnd~type)
par(mfrow=c(1,1))
# Hva ser du av plottene?
#
Gj?r innledende regresjonsanalyser med hver variabel for seg:
fit1<-lm(mnd~size)
fit2<-lm(mnd~type)
summary(fit1)
summary(fit2)
# Hvilken variabel forklarer alene mest av
variasjonen i bel?pene?
# Har variablene (alene) signifikant betydning?
#
I den siste regresjonsmodellen
har vi bare ?n kategorisk kovariat.
#
Kunne vi testet
effekten av den p? en annen m?te?
Ville det gitt
noen forskjell?
#
Gj?r regresjonsanalyse med begge kovariatene samtidig:
fit3<-lm(mnd~size+type)
summary(fit3)
#
Hva sier denne modellen deg? Ser den bedre ut en den beste modellen med bare ?n kovariat?
# Pr?v selv med modeller med andregrads ledd for size og/eller med interaksjon.