R kode som illustrerer test og konfidensintervall for sammenligning av to populasjonsgjennomsnitt ved store utvalg (avsnitt 10.1)
# Vi vil illustrere teorien på sidene 478-482 i læreboka ved å se på vekten til et tilfeldig utvalg av 2116 nyfødte gutter og 1950 nyfødte jenter.
# Vi vil (i) teste om det er forskjell på forventet fødselsvekt for gutter og jenter og (ii) bestemme et (tilnærmet) 95% konfidensintervall for forskjellen i forventet fødselsvekt.
# Vi leser inn datafilen som inneholder fødselsvektene (og mere til):
fvekt=read.table("http://www.uio.no/studier/emner/matnat/math/STK1110/h12/fvekt.txt",header=T)
# Vi trekker ut fødselsvektene for gutter og jenter:
fvekt.gutt=fvekt$vekt[fvekt$kjonn==1]
fvekt.jente=fvekt$vekt[fvekt$kjonn==2]
# Vi lager boxplott av fødselsvektene:
boxplot(fvekt.gutt,fvekt.jente,names=c("Gutt","Jente"))
# Vi betemmer testobservatoren [jf side 479 i læreboka]
m=length(fvekt.gutt)
n=length(fvekt.jente)
s1=sd(fvekt.gutt)
s2=sd(fvekt.jente)
z=(mean(fvekt.gutt)-mean(fvekt.jente))/sqrt(s1^2/m+s2^2/n)
# Vi betemmer 95% konfidensintervall for forskjellen i forventet fødselsvekt mellom gutter og jenter [jf side 481 i læreboka]
l=mean(fvekt.gutt)-mean(fvekt.jente)-1.96*sqrt(s1^2/m+s2^2/n)
u=mean(fvekt.gutt)-mean(fvekt.jente)+1.96*sqrt(s1^2/m+s2^2/n)
print(c(l,u),2)