STK1000: F?RSTE SETT MED OBLIGATORISKE OPPGAVER

H?sten 2011

 

Oppgavesettet til f?rste obligatoriske innlevering i STK1000 h?sten 2011 best?r av tre oppgaver. For ? l?se de to f?rste oppgavene trenger du hjelp av MINITAB eller annen statistisk programvare. I forbindelse med bruk av MINITAB kan du ha nytte av notatet Starthjelp i MINITAB (kalt "innf?ringsheftet" nedenfor). Det er tilgjengelig p? hjemmesiden til kurset.

I den skriftlige besvarelsen av oppgavene skal du kort forklare hvordan de enkelte punktene er l?st. Det er valgfritt om du vil skrive besvarelsen for h?nd eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, m? relevante utskrifter og plott settes inn i besvarelsen. Instruksjoner for utskrift fra MINITAB finner du i innf?ringsheftet.

Det er lov ? 澳门葡京手机版app下载e og ? bruke hjelpemidler. Den innleverte besvarelsen skal imidlertid skrives av deg og gjenspeile din forst?else av stoffet. Er vi i tvil om at du virkelig har forst?tt det du har levert inn, kan vi be deg om en muntlig redegj?relse.

Besvarelsen leveres p? instituttkontoret ved Matematisk Institutt i 7. etasje, Niels Henrik Abels hus (Matematikkbygningen). Konsulter http://www.mn.uio.no/math/studier/obligerh11.html for regler for obligatoriske innleveringer f?r du setter i gang! Obligen skal leveres med en egen forside som du ogs? finner der. 

Frist for innlevering er torsdag 29. september 2011 kl 14.30.

 

Oppgave 1

Karbondioksid (CO2) er en gass som dannes n?r man brenner fossile brensler, og bidrar bl.a. til global oppvarming. P? side 26 i l?reboken (Moore, McCabe & Craig, 7. utg.) finner du en tabell over CO2-utslipp i tonn per person i 2006 fra land med mer enn 20 millioner innbyggere. Tallene er gitt i filen  co2.MTP . Hvis du allerede har lastet ned datafilene fra boken, finner du den med navnet co2 i kapittel 1.

a) Del verdiomr?det opp i passende delintervaller og tell opp antall observasjoner i hvert delintervall. Tegn for h?nd et histogram for de 48 observasjonene. Kommenter histogrammets form.

b) Lag et histogram over de 48 observasjonene ved hjelp av MINITAB (kommando: Graph -> Histogram; jfr. avsnitt 8.3 i innf?ringsheftet). Sammenlign med histogrammet du lagde i a). Lag ogs? et stilk-og-blad-plott (Graph -> Stem-and-Leaf). Hvilke land skiller seg ut? Frivillig: Finn ut hvor i fordelingen Norges CO2-utslipp ligger.

c) Hvilke oppsummerende m?l b?r brukes for ? beskrive en fordeling som den du ser i a) og b)? Begrunn svaret. Beregn disse ved hjelp av MINITAB (kommando: Stat -> Basic Statistics -> Display Descriptive Statistics; jfr. avsnitt 8.1 i innf?ringsheftet - plukk ut det du trenger fra utskriften).

d) Bruk MINITAB til ? lage et boxplot over dataene. Beskriv og beregn kriteriet som ligger til grunn for at en observasjon er markert med stjerne-symbol i plottet. Syns du denne potensielle uteliggeren burde fjernes fra datasettet i videre analyser? Begrunn svaret.

 

Oppgave 2

I denne oppgaven skal vi se p? data som er samlet inn p? et begynnerkurs i statistikk ved et amerikansk universitet. Studentene i kurset gjennomf?rte et enkelt fors?k. Hver student noterte sin h?yde og vekt og m?lte pulsen sin (under hvile). S? kastet hver av studentene en mynt. De som fikk kron l?p p? stedet i ett minutt, mens de som fikk mynt ble sittende stille i ett minutt. S? m?lte alle pulsen en gang til (for de som satt stille, er dette en m?ling til av pulsen under hvile). Dataene for de 92 studentene ligger i Minitabfilen Pulse.MTW. I datafilen er det en linje for hver av de 92 studentene, der variablene i kolonnene har f?lgende betydning:

Den siste variabelen Activity skal du ikke bry deg om. N?r du har lastet dataene inn i MINITAB, registrerer du dine egne verdier for variablene Smokes,Sex, Height og Weight i linje 93 i arbeidsarket (husk ? regne om til hhv. inches og pounds). M?l pulsen din under hvile og registrer den som Puls1. Kast s? et kronestykke. Hvis det viser krone, l?per du p? stedet i ett minutt. Hvis ikke sitter du stille ett minutt. S? m?ler du pulsen din igjen og registrer den som Puls2 i linje 93 i arbeidsarket. Skriv ogs? inn din verdi for Ran (1 hvis du l?p, 2 hvis du satt stille).

Med dette modifiserte datasettet:

a) Lag histogram for variabelen Pulse1 og merk av din egen verdi. Lag ogs? et kvantilplott og avgj?r p? bakgrunn av plottet og histogrammet om fordelingen er tiln?rmet normal.

b) Beregn enkle oppsummerende m?l for den samme variabelen. Hvordan ligger din egen verdi i dette bildet?

c) Lag et scatterplot med Pulse1 p? x-aksen og Pulse2 p? y-aksen, med forskjellige symboler for de som l?p og de som ikke l?p. Forklar hva plottet viser. Lag andre grafiske fremstillinger som viser effekten av aktivitet p? Pulse2.

d) Bruk Data-> Split Worksheet til ? lage ett datasett for de som l?p, og ett for de som ikke l?p. Velg bare de som l?p, og tilpass en regresjonslinje til sammenhengen mellom Pulse1 og Pulse2 ved hjelp av Stat -> Regression -> Fitted Line Plot.  Skriv formlene for skj?ringspunkt og stigningstall til den tilpassede regresjonslinjen, finn verdier for disse fra utskriften og forklar hvordan den tilpassede modellen skal tolkes.  

e) Du skal n? belyse hvordan r?yking p?virker sammenhengen mellom Pulse1 og Pulse2 for de som har l?pt. Bruk for eksempel scatterplott med to grupper og to regresjonslinjer, og skriv noen linjer om effekten av r?yking p? hvordan pulsen endres ved belastning (l?ping). Er forskjellen p? r?ykere og ikke-r?ykere slik man skulle forvente?

f) G? tilbake til det fulle datasettet med 93 individer. Gjennomf?r en regresjonsanalyse med vekt som responsvariabel og h?yde som forklaringsvariabel. Forklar hva resultatene av regresjonsanalysen forteller. (Kommandoer: Stat -> Regression -> Regression og Stat -> Regression -> Fitted Line Plot.)

g) Lag et residualplott ved hjelp av Stat -> Regression -> Regression, klikk p? Graphs og be om ? f? plottet residualer versus forklaringsvariabelen h?yde. Kommenter hvordan plottet ser ut og hvordan dette tolkes. Har datasettet noen spesielt innflytelsesrike observasjoner, og hvordan ser du i tilfelle at det er slik?

h) Forklar hva R-Sq (r-kvadrert) i utskriften betyr. Hva er korrelasjonen mellom h?yde og vekt?

i) Det er egentlig slik at sammenhengen mellom h?yde og vekt er sv?rt forskjellig for kvinner og menn. For ? se dette, m? du dele datasettet igjen, og gj?re regresjonsanalyser separat for kvinner og for menn. Hvordan kan det ha seg at R-Sq er mye d?rligere b?de for kvinner og for menn separat enn n?r vi tilpasser en line?r modell til hele datasettet? Illustrer forklaringen din med et scatterplott for hele datasettet med forskjellig farge for kvinner og menn.

 

Oppgave 3

En fartsm?ler er plassert ved en motorvei. Vi antar at farten til bilene som passerer kan antas normalfordelt  med forventning 90 km/t og standardavvik 10 km/t. Finn ved hjelp av tabell A i boken

a) ...andelen biler som kj?rer fortere enn 100 km/t.

c) ...andelen biler som kj?rer mellom 90 og 100 km/t.

b) ...hvor fort de raskeste 10% kj?rer (minst).

 

                                                                                                                                        LYKKE TIL MED ARBEIDET!