STV1020 / STV1021 Metode og statistikk - Høst 2010

 

SAMFUNNSVITENSKAPELIG EMBETSEKSAMEN 2010II

Statsvitenskap innføring. STV1020 /STV1021 – Metode og statistikk.

Mandag 6. desember 2010, 4 timer

 

 

Alle oppgaver skal besvares.

 

I

 

Under overskriften ”Kvinner haler inn på menn” rapporterte Aftenposten 21. oktober i år at kvinners inntekter økte tre ganger så mye som menns i 2009. Grunnlaget for overskriften var beregninger basert på alle ligningstall for 2009. Sett fra et likelønnsperspektiv er dette gode nyheter. Men likevel har menn mye høyere inntekt enn kvinner. I gjennomsnitt hadde menn kr. 281 091 i nettoinntekt i 2009 mens kvinner hadde kr. 186 172.

 

  1. Hva menes med stigningskoeffisienten i en regresjonsanalyse?
  2. Med utgangspunktet i informasjon gitt ovenfor, hva er verdien til stigningskoeffisienten i en regresjonsanalyse med nettoinntekt som avhengig variabel og kjønn som uavhengig variabel når kjønn er kodet 0 = menn og 1 = kvinner? Begrunn svaret.
  3. Hva menes med konstantleddet i en regresjonsanalyse?
  4. Hva er verdien av konstantleddet i regresjonsanalysen beskrevet under oppgave Ib?
  5. For regresjonsanalysen beskrevet under punkt Ib har R2 en verdi på 0,07. Hvordan tolker du dette?
  6. For en lignende regresjonsanalyse utført med ligningstall for 1999 hadde R2 en verdi på 0,11. Hva slags utviklingstendens tyder dette på?

 

 

II

 

Som forsker er du interessert i hvilke forhold i tillegg til kjønn kan forklare lønnsforskjeller. For å undersøke dette bestemmer du deg for å gjennomføre en spørreundersøkelse. Til dette formål får du tildelt midler fra Barne-, likestillings- og inkluderingsdepartementet (BLD). Du har en hypotese om at lønn kan variere etter bosted – nærmere bestemt at folk bosatt i kommuner med mange innbyggere i gjennomsnitt har høyere inntekt enn folk bosatt i mindre kommuner. For å gjennomføre undersøkelsen bestemmer du deg for å bruke et disproporsjonalt stratifisert utvalg.

 

  1. Redegjør kort for hva som menes med disproporsjonalt stratifisert utvelging og hvordan dette gjøres?
  2. Hva er en forutsetning for å kunne gjøre bruk av stratifisering?
  3. Hva menes med stratifiseringsvariabel og hva vil stratifiseringsvariabelen være i dette tilfellet?
  4. Hva kan være hensikten med å bruke et disproporsjonalt stratifisert utvalg i dette tillfellet?

 

Statistisk sentralbyrå gjennomfører undersøkelsen og legger til informasjon om den enkeltes netto­inntekt i 2007 fra sentrale dataregistrer. Alle opplysninger blir registrert i en SPSS datafil.

  1. I SPSS er det flere vinduer. Gjør kort rede for forskjellene mellom ”Data view” vinduet, ”Variable view” vinduet og”Syntax editor” vinduet.
  2. Dersom du ønsker å endre på verdier som skal betraktes som ”Missing” (dvs. verdier som eugyldig for bestemte analyser), hvilket vindu er det mest naturlig å bruke?

Det første du gjør er å gjennomføre en regresjonsanalyse med den enkeltes nettoinntekt i 2007 som avhengig variabel og med kjønn som uavhengig variabel. Også nå er kjønn kodet 0 = menn og 1 = kvinner. Resultatet finnes i tabell 1:

 

Tabell 1:  Nettoinntekt 2007 betinget av kjønn (N=2527)

 

Coefficientsa

Model

Unstandardized Coefficients

Standardized Coefficients

t

Sig.

B

Std. Error

Beta

1

(Constant)

299633.38

4213.93

 

71.105

.000

Kjønn

-79922.54

6003.51

-.256

-13.313

.000

a. Dependent Variable: Nettoinntekt 2007

 

  1. Bruk informasjon fra tabell 1 til å skrive en regresjonligning for resultatet.
  2. Skriv også en ligning for regresjonsanalysen fra oppgave Ib ovenfor. Er hovedtendensen den samme? Er det noen forskjeller i resultatene og i så fall hva kan være aktuelle metodologiske forklaringer på disse?
  3. Hvordan er t-verdien for kjønn i tabell 1 beregnet og hva forteller den oss?

 

For å undersøke din hypotese gjennomfører du en ny regresjonsanalyse, den gang med både kjønn og antall innbyggere i den enkeltes bostedskommune pr. 1.1.2008 som uavhengige variabler. Resultatet er framstilt i tabell 2:

 

Tabell 2:   Nettoinntekt 2007 betinget av kjønn og kommunestørrelse (N=2527)

 

Coefficientsa

Model

Unstandardized Coefficients

Standardized Coefficients

T

Sig.

B

Std. Error

Beta

1

(Constant)

296981.02

4395.168

 

67.570

.000

Kjønn

-80050.24

5999.734

-.257

-13.342

.000

Antall innbyggere 1.1.2008

.09

.045

.041

2.107

.035

a. Dependent Variable: Nettoinntekt 2007

 

  1. Gir resultatene støtte til din hypotese eller ikke? Begrunn svaret.
  2. Hvordan tolker du koeffisienten B for konstantleddet (296981.02) i tabell 2? Er dette resultatet meningsfylt? Begrunn svaret.

 

Du er i tillegg interessert i å undersøke om hvilken sektor den enkelte er yrkesmessig knyttet til har betydning for lønn. Du gjennomfører derfor nok en regresjonsanalyse med en yrkessektor variabel som er kodet 0 = offentlig sektor, 1 = privat sektor. Resultatet er framstilt i tabell 3.

 

Tabell 3:   Nettoinntekt 2007 betinget av kjønn, kommunestørrelse og yrkessektor (N=2452)

 

Coefficientsa

Model

Unstandardized Coefficients

Standardized Coefficients

t

Sig.

B

Std. Error

Beta

1

(Constant)

298062.11

6896.138

 

43.222

.000

Kjønn

-80180.84

6564.279

-.256

-12.215

.000

Antall innbyggere 1.1.2008

.10

.046

.042

2.139

.033

Yrkessektor 2-delt

2978.47

6747.920

.009

.441

.659

a. Dependent Variable: Nettoinntekt 2007

  1. Hva kan du si om betydning av den enkeltes yrkessektor basert på resultatene i tabell 3? Begrunn svaret.
  2. Antallet enheter (N) som inngår i analysen i tabell 2 er 2527, mens antallet enheter som inngår i analysen i tabell 3 er 2452. Hvordan kan du forklare differansen?

 

III

 

I undersøkelsen stiller du også følgende spørsmål om folks holdninger til likestilling:” I de senere år er det lagt vekt på å skape likestilling mellom kvinner og menn. Vil du si at likestilling bør føres videre, er den ført langt nok, er den ført for langt, eller har du ingen mening?” Svarfordelingen er framstilt i tabell 4.

 

Tabell 4:   Holdninger til likestilling

 

 

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

1 Bør føres videre

         1138

      56.6

            60.4

                    60.4

2 Ført langt nok

           628

      31.2

            33.3

                    93.7

3 Ført for langt

           118

         5.9

              6.3

                  100.0

Total

         1884

      93.6

          100.0

 

Missing

System

           128

         6.4

 

 

Total

         2012

    100.0

 

 

 

  1. Redegjør kort for hva kolonnen ”Cumulative Percent” inneholder.
  2. Tegn et stolpediagram som framstiller svarfordelingen basert på prosentandelene i kolonnen ”Valid percent”.
  3. Hva menes med modalprosent og hva er modalprosenten i tabell 4?

 

Du tror folks holdninger til likestilling varierer med alder, og at yngre personer er mer positive til likestilling enn eldre er. For å undersøke dette omkoder du aldersvariabelen i fire kategorier og gjennomfører en krysstabellanalyse. Resultatet er framstilt i tabell 5.

 

Tabell 5:   Holdninger til likestilling etter aldersgrupper

 

 

IOs aldersgruppe

Total

16-24 år

25-44 år

45-66 år

67-79 år

 

 

Bør føres videre        Count

96

447

476

119

1138

                                            %

46.8%

64.4%

64.4%

48.4%

60.4%

 

Ført langt nok            Count

92

205

226

105

628

                                            %

44.9%

29.5%

30.6%

42.7%

33.3%

 

Ført for langt              Count

17

42

37

22

118

                                            %

8.3%

6.1%

5.0%

8.9%

6.3%

 

Total                            Count

205

694

739

246

1884

                                            %

100.0%

100.0%

100.0%

100.0%

100.0%

 

  1. Hva menes med en variabels målenivå og hvilket målenivå har variablene i tabell 5?
  2. Hva slags inntrykk gir resultatene? Er de i tråd med dine forventninger? Begrunn svaret.
  3. For å kontrollere om inntrykket du har er riktig eller ikke, bestemmer du deg for å beregne gamma for tabellen. Hva er resultatet og hvordan tolker du det?
  4. Dersom du hadde beregnet korrelasjonskoeffisient tau i stedet for gamma, hadde koeffisientens absolutt tallverdi vært større, omtrent den samme eller mindre enn verdien for gamma? Begrunn svaret.

 

IV

 

Du bestemmer deg for å gå videre og bruke en enklere inndeling av aldersvariabelen med bare to kategorier – en for alle som er under 45 år, den andre for alle som er 45 år og eldre.

 

  1. Hvilket målenivå har den forenklede aldersvariabelen? Begrunn svaret.
  2. Framstill den forenklede tabellen med absolutte tall.
  3. Hva er odds for at personer under 45 år skal mene at likestilling bør føres videre, og hva er samme odds for personer 45 år eller eldre?
  4. Hva er odds ratio for at personer under 45 år skal mene at likestilling bør føres videre sett i forhold til at personer 45 år eller eldre mener det samme, og hvordan tolker du resultatet?
  5. Hvilke korrelasjonskoeffisienter kan du bruke for å analysere sammenhengen mellom alder og holdning til likestilling i den forenklede tabellen framstilt i forbindelse med oppgave IVb? Begrunn svaret.
  6. Gjennomfør en kjikvadrattest for å vurdere om resultatene i den forenklede tabellen gir grunnlag for å generalisere fra utvalget til universet ved et signifikansnivå på 5 prosent.
  7. Hvilke forhold påvirker feilmarginen for statistikk beregnet på grunnlag at utvalgs­undersøkelser?

 

Publisert 24. juni 2015 13:28 - Sist endret 24. juni 2015 13:28