SAMFUNNSVITENSKAPELIG EMBETSEKSAMEN 2010II
Statsvitenskap innføring. STV1020 /STV1021 – Metode og statistikk.
Mandag 6. desember 2010, 4 timer
Alle oppgaver skal besvares.
I
Under overskriften ”Kvinner haler inn på menn” rapporterte Aftenposten 21. oktober i år at kvinners inntekter økte tre ganger så mye som menns i 2009. Grunnlaget for overskriften var beregninger basert på alle ligningstall for 2009. Sett fra et likelønnsperspektiv er dette gode nyheter. Men likevel har menn mye høyere inntekt enn kvinner. I gjennomsnitt hadde menn kr. 281 091 i nettoinntekt i 2009 mens kvinner hadde kr. 186 172.
- Hva menes med stigningskoeffisienten i en regresjonsanalyse?
- Med utgangspunktet i informasjon gitt ovenfor, hva er verdien til stigningskoeffisienten i en regresjonsanalyse med nettoinntekt som avhengig variabel og kjønn som uavhengig variabel når kjønn er kodet 0 = menn og 1 = kvinner? Begrunn svaret.
- Hva menes med konstantleddet i en regresjonsanalyse?
- Hva er verdien av konstantleddet i regresjonsanalysen beskrevet under oppgave Ib?
- For regresjonsanalysen beskrevet under punkt Ib har R2 en verdi på 0,07. Hvordan tolker du dette?
- For en lignende regresjonsanalyse utført med ligningstall for 1999 hadde R2 en verdi på 0,11. Hva slags utviklingstendens tyder dette på?
II
Som forsker er du interessert i hvilke forhold i tillegg til kjønn kan forklare lønnsforskjeller. For å undersøke dette bestemmer du deg for å gjennomføre en spørreundersøkelse. Til dette formål får du tildelt midler fra Barne-, likestillings- og inkluderingsdepartementet (BLD). Du har en hypotese om at lønn kan variere etter bosted – nærmere bestemt at folk bosatt i kommuner med mange innbyggere i gjennomsnitt har høyere inntekt enn folk bosatt i mindre kommuner. For å gjennomføre undersøkelsen bestemmer du deg for å bruke et disproporsjonalt stratifisert utvalg.
- Redegjør kort for hva som menes med disproporsjonalt stratifisert utvelging og hvordan dette gjøres?
- Hva er en forutsetning for å kunne gjøre bruk av stratifisering?
- Hva menes med stratifiseringsvariabel og hva vil stratifiseringsvariabelen være i dette tilfellet?
- Hva kan være hensikten med å bruke et disproporsjonalt stratifisert utvalg i dette tillfellet?
Statistisk sentralbyrå gjennomfører undersøkelsen og legger til informasjon om den enkeltes nettoinntekt i 2007 fra sentrale dataregistrer. Alle opplysninger blir registrert i en SPSS datafil.
- I SPSS er det flere vinduer. Gjør kort rede for forskjellene mellom ”Data view” vinduet, ”Variable view” vinduet og”Syntax editor” vinduet.
- Dersom du ønsker å endre på verdier som skal betraktes som ”Missing” (dvs. verdier som eugyldig for bestemte analyser), hvilket vindu er det mest naturlig å bruke?
Det første du gjør er å gjennomføre en regresjonsanalyse med den enkeltes nettoinntekt i 2007 som avhengig variabel og med kjønn som uavhengig variabel. Også nå er kjønn kodet 0 = menn og 1 = kvinner. Resultatet finnes i tabell 1:
Tabell 1: Nettoinntekt 2007 betinget av kjønn (N=2527)
Coefficientsa |
||||||
---|---|---|---|---|---|---|
Model |
Unstandardized Coefficients |
Standardized Coefficients |
t |
Sig. |
||
B |
Std. Error |
Beta |
||||
1 |
(Constant) |
299633.38 |
4213.93 |
|
71.105 |
.000 |
Kjønn |
-79922.54 |
6003.51 |
-.256 |
-13.313 |
.000 |
|
a. Dependent Variable: Nettoinntekt 2007 |
- Bruk informasjon fra tabell 1 til å skrive en regresjonligning for resultatet.
- Skriv også en ligning for regresjonsanalysen fra oppgave Ib ovenfor. Er hovedtendensen den samme? Er det noen forskjeller i resultatene og i så fall hva kan være aktuelle metodologiske forklaringer på disse?
- Hvordan er t-verdien for kjønn i tabell 1 beregnet og hva forteller den oss?
For å undersøke din hypotese gjennomfører du en ny regresjonsanalyse, den gang med både kjønn og antall innbyggere i den enkeltes bostedskommune pr. 1.1.2008 som uavhengige variabler. Resultatet er framstilt i tabell 2:
Tabell 2: Nettoinntekt 2007 betinget av kjønn og kommunestørrelse (N=2527)
Coefficientsa |
||||||
---|---|---|---|---|---|---|
Model |
Unstandardized Coefficients |
Standardized Coefficients |
T |
Sig. |
||
B |
Std. Error |
Beta |
||||
1 |
(Constant) |
296981.02 |
4395.168 |
|
67.570 |
.000 |
Kjønn |
-80050.24 |
5999.734 |
-.257 |
-13.342 |
.000 |
|
Antall innbyggere 1.1.2008 |
.09 |
.045 |
.041 |
2.107 |
.035 |
|
a. Dependent Variable: Nettoinntekt 2007 |
- Gir resultatene støtte til din hypotese eller ikke? Begrunn svaret.
- Hvordan tolker du koeffisienten B for konstantleddet (296981.02) i tabell 2? Er dette resultatet meningsfylt? Begrunn svaret.
Du er i tillegg interessert i å undersøke om hvilken sektor den enkelte er yrkesmessig knyttet til har betydning for lønn. Du gjennomfører derfor nok en regresjonsanalyse med en yrkessektor variabel som er kodet 0 = offentlig sektor, 1 = privat sektor. Resultatet er framstilt i tabell 3.
Tabell 3: Nettoinntekt 2007 betinget av kjønn, kommunestørrelse og yrkessektor (N=2452)
Coefficientsa |
||||||
---|---|---|---|---|---|---|
Model |
Unstandardized Coefficients |
Standardized Coefficients |
t |
Sig. |
||
B |
Std. Error |
Beta |
||||
1 |
(Constant) |
298062.11 |
6896.138 |
|
43.222 |
.000 |
Kjønn |
-80180.84 |
6564.279 |
-.256 |
-12.215 |
.000 |
|
Antall innbyggere 1.1.2008 |
.10 |
.046 |
.042 |
2.139 |
.033 |
|
Yrkessektor 2-delt |
2978.47 |
6747.920 |
.009 |
.441 |
.659 |
|
a. Dependent Variable: Nettoinntekt 2007 |
- Hva kan du si om betydning av den enkeltes yrkessektor basert på resultatene i tabell 3? Begrunn svaret.
- Antallet enheter (N) som inngår i analysen i tabell 2 er 2527, mens antallet enheter som inngår i analysen i tabell 3 er 2452. Hvordan kan du forklare differansen?
III
I undersøkelsen stiller du også følgende spørsmål om folks holdninger til likestilling:” I de senere år er det lagt vekt på å skape likestilling mellom kvinner og menn. Vil du si at likestilling bør føres videre, er den ført langt nok, er den ført for langt, eller har du ingen mening?” Svarfordelingen er framstilt i tabell 4.
Tabell 4: Holdninger til likestilling
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
|
---|---|---|---|---|---|
Valid |
1 Bør føres videre |
1138 |
56.6 |
60.4 |
60.4 |
2 Ført langt nok |
628 |
31.2 |
33.3 |
93.7 |
|
3 Ført for langt |
118 |
5.9 |
6.3 |
100.0 |
|
Total |
1884 |
93.6 |
100.0 |
|
|
Missing |
System |
128 |
6.4 |
|
|
Total |
2012 |
100.0 |
|
|
- Redegjør kort for hva kolonnen ”Cumulative Percent” inneholder.
- Tegn et stolpediagram som framstiller svarfordelingen basert på prosentandelene i kolonnen ”Valid percent”.
- Hva menes med modalprosent og hva er modalprosenten i tabell 4?
Du tror folks holdninger til likestilling varierer med alder, og at yngre personer er mer positive til likestilling enn eldre er. For å undersøke dette omkoder du aldersvariabelen i fire kategorier og gjennomfører en krysstabellanalyse. Resultatet er framstilt i tabell 5.
Tabell 5: Holdninger til likestilling etter aldersgrupper
|
IOs aldersgruppe |
Total |
|||||
---|---|---|---|---|---|---|---|
16-24 år |
25-44 år |
45-66 år |
67-79 år |
||||
|
|
Bør føres videre Count |
96 |
447 |
476 |
119 |
1138 |
% |
46.8% |
64.4% |
64.4% |
48.4% |
60.4% |
||
|
Ført langt nok Count |
92 |
205 |
226 |
105 |
628 |
|
% |
44.9% |
29.5% |
30.6% |
42.7% |
33.3% |
||
|
Ført for langt Count |
17 |
42 |
37 |
22 |
118 |
|
% |
8.3% |
6.1% |
5.0% |
8.9% |
6.3% |
||
|
Total Count |
205 |
694 |
739 |
246 |
1884 |
|
% |
100.0% |
100.0% |
100.0% |
100.0% |
100.0% |
- Hva menes med en variabels målenivå og hvilket målenivå har variablene i tabell 5?
- Hva slags inntrykk gir resultatene? Er de i tråd med dine forventninger? Begrunn svaret.
- For å kontrollere om inntrykket du har er riktig eller ikke, bestemmer du deg for å beregne gamma for tabellen. Hva er resultatet og hvordan tolker du det?
- Dersom du hadde beregnet korrelasjonskoeffisient tau i stedet for gamma, hadde koeffisientens absolutt tallverdi vært større, omtrent den samme eller mindre enn verdien for gamma? Begrunn svaret.
IV
Du bestemmer deg for å gå videre og bruke en enklere inndeling av aldersvariabelen med bare to kategorier – en for alle som er under 45 år, den andre for alle som er 45 år og eldre.
- Hvilket målenivå har den forenklede aldersvariabelen? Begrunn svaret.
- Framstill den forenklede tabellen med absolutte tall.
- Hva er odds for at personer under 45 år skal mene at likestilling bør føres videre, og hva er samme odds for personer 45 år eller eldre?
- Hva er odds ratio for at personer under 45 år skal mene at likestilling bør føres videre sett i forhold til at personer 45 år eller eldre mener det samme, og hvordan tolker du resultatet?
- Hvilke korrelasjonskoeffisienter kan du bruke for å analysere sammenhengen mellom alder og holdning til likestilling i den forenklede tabellen framstilt i forbindelse med oppgave IVb? Begrunn svaret.
- Gjennomfør en kjikvadrattest for å vurdere om resultatene i den forenklede tabellen gir grunnlag for å generalisere fra utvalget til universet ved et signifikansnivå på 5 prosent.
- Hvilke forhold påvirker feilmarginen for statistikk beregnet på grunnlag at utvalgsundersøkelser?