Hvordan Lage Dummy Variabler I SPSS?

du kan ikke lett bruke kategoriske variabler som prediktorer i lineær regresjon: du må bryte dem opp i dikotom variabler kjent som dummy variabler.
den ideelle måten å lage disse er vår dummy variabler verktøy. Hvis du ikke vil bruke dette verktøyet, viser denne opplæringen den riktige måten å gjøre det manuelt.

  • Eksempel I – En Numerisk Variabel
  • EKSEMPEL II – Numerisk Variabel Med Tilstøtende Heltall
  • EKSEMPEL III – Streng Variabel Med Konvertering
  • EKSEMPEL IV – Streng Variabel uten Konvertering

Eksempel Datafil

denne opplæringen bruker ansatte.sav gjennom hele. En del av denne datafilen er vist nedenfor.

SPSS Staff Data View

Eksempel I – En Numerisk Variabel

La oss først lage dummy variabler for marit, kort for sivilstatus. Vårt første steg er å kjøre EN BASISTABELL med frekvenser marit.Tabellen nedenfor viser den resulterende tabellen.

Lage Dummy Variabler I SPSS Frekvenser Marit

Så hvordan å bryte opp sivilstand i dummy variabler? For det første utelater vi alltid en kategori, referansekategorien. Du kan velge hvilken som helst kategori som referanse kategori.

Så for dette eksemplet velger vi 5 (Enke). Dette innebærer at vi lager 3 dummyvariabler som representerer kategori 1, 2 og 4 (merk at 3 ikke forekommer i denne variabelen).

syntaksen nedenfor viser hvordan du oppretter og merker våre 3 dummyvariabler. La oss kjøre den.

*Lag dummyvariabler for kategori 1, 2 og 4.
beregn marit_1 = (marit = 1).
beregn marit_2 = (marit = 2).
beregn marit_4 = (marit = 4).* Bruk variable etiketter til dummy variabler .
variable etiketter
marit_1 ‘Sivilstatus = Aldri Gift’
marit_2 ‘Sivilstatus = For Tiden Gift’
marit_4’Sivilstatus = Skilt’.
*Rask sjekk første dummy variabel
frekvenser marit_1.

Resultater

Først av, merk at vi opprettet 3 pent merkede dummy variabler i vårt aktive datasett.

SPSS Lag Dummyvariabler Resultat 1

tabellen nedenfor viser frekvensfordelingen for vår første dummyvariabel.

Frekvens Tabell Dummy Variabel

Merk at vår dummy variabel inneholder 3 forskjellige verdier:

  • respondenter hvis sivilstand ikke er «aldri gift» score 0;
  • respondenter hvis sivilstand er «aldri gift» score 1;
  • respondenter hvis sivilstand er en manglende verdi (og derfor ukjent) har et system som mangler verdi.

vi kan nå sjekke resultatene grundigere ved å runningcrosstabs marit by marit_1 til marit_4.Dette skaper 3 beredskapstabeller, hvorav den første er vist nedenfor.

SPSS Lag Dummy Variabler Sjekk Resultater 1

på vår dummy variabel,
respondenter som «aldri gift» all score 1;
vi har en utvalgsstørrelse På N = 170 (denne tabellen inneholder bare respondenter uten manglende verdier på hver variabel).Eventuelt er en endelig-veldig grundig – sjekk å sammenligne ANOVA-resultater for den opprinnelige variabelen til regresjonsresultater ved hjelp av våre dummyvariabler. Syntaksen nedenfor gjør nettopp det, ved hjelp av månedslønn som den avhengige variabelen.

*Minimal regresjon ved hjelp av dummy variabler.
regresjon
/ avhengig lønn
/ metode skriv inn marit_1 til marit_4.
*Minimal ANOVA ved hjelp av original variabel.
oneway lønn av marit.

Merk at begge analysene resulterer i identiske ANOVA-tabeller. VI vil diskutere ANOVA versus dummy variabel regresjon mer grundig i en fremtidig opplæring.

Eksempel II-Numerisk Variabel med Tilstøtende Heltall

vi lager nå dummy variabler for region. Igjen, vi starter med å inspisere en minimal frekvens tabell som vi vil skape ved runningfrequencies region.Dette resulterer i tabellen nedenfor.

Lage Dummy Variabler I SPSS Frekvenser Region

vi velger 1 («Nord») som vår referansekategori. Vi vil derfor lage dummyvariabler for kategori 2 til 5. Siden disse er tilstøtende heltall, kan vi øke hastigheten ved Å bruke GJENTA SOM vist nedenfor.

*Lag dummy variabler for region kategorier 2 til 5.
gjenta #vals = 2 til 5 / # vars = region_2 til region_5.
recode region (#vals = 1) (lo gjennom hi = 0) til # vars.
avslutt gjenta utskrift.
*Bruk variable etiketter til nye variabler.
variable etiketter
region_2 ‘Region = Øst’
region_3 ‘Region = Sør’
region_4 ‘Region = Vest’
region_5 ‘Region = Topp 4 By’.
*Rask sjekk.
crosstabs region av region_2 til region_5.

en nøye inspeksjon av de resulterende tabellene bekrefter at alle resultatene er riktige.

EKSEMPEL III – Strengvariabel med Konvertering

Dessverre fungerer Våre første 2 metoder ikke for strengvariabler som jtype-kort for «jobbtype»). Den enkleste løsningen er å konvertere den til en numerisk variabel som diskutert I SPSS Konverter Streng Til Numerisk Variabel. Syntaksen nedenfor bruker AUTOKODE for å få jobben gjort.* Konverter jtype til numerisk variabel .
autokode jtype
/ inn i njtype.
*Sjekk resultat.
frekvenser njtype.* Angi manglende verdier.
manglende verdier njtype (1,2).
* Kontroller resultatet.
frekvenser njtype.

Resultat

SPSS Lag Dummy Variabler Frekvens Tabell Njtype

siden njtype-kort for «numerisk jobbtype»- er en numerisk variabel, kan vi nå bruke metode i eller metode II for å bryte den opp i dummy variabler.

Eksempel IV-String Variabel uten Konvertering

Konvertere strengvariabler til numeriske seg er lett å lage dummy variabler for dem. Uten denne konverteringen er prosessen tungvint fordi SPSS ikke håndterer manglende verdier for strengvariabler riktig. Syntaksen nedenfor får imidlertid jobben gjort riktig.

*Kontroller frekvenser.
frekvenser jtype.
*Sjanse ‘(Ukjent)’ inn I ‘NA’.
recode jtype (‘(Ukjent) ‘ = ‘NA’).* Sett bruker mangler verdier .
manglende verdier jtype ( » ,’NA’).
*Kontroller frekvenser på nytt.
frekvenser jtype.* Lag dummy variabler for streng variabel.
hvis(ikke mangler(jtype)) jtype_1 = (jtype = ‘DET’).
hvis(ikke mangler(jtype)) jtype_2 = (jtype = ‘Ledelse’).
hvis(ikke mangler(jtype)) jtype_3 = (jtype = ‘Salg’).
hvis(ikke mangler(jtype)) jtype_4 = (jtype = ‘Ansatte’).* Bruk variable etiketter til dummy variabler .
variable etiketter
jtype_1 ‘Jobbtype = IT’
jtype_2 ‘Jobbtype = Ledelse’
jtype_3 ‘ Jobbtype = Salg ‘
jtype_4’Jobbtype = Ansatte’.
*Sjekk resultatene.
crosstabs jtype av jtype_1 til jtype_4.

Endelige Notater

Opprette dummy variabler for numeriske variabler kan gjøres raskt og enkelt. Sette riktig variable etiketter, men tar alltid litt arbeid. Strengvariabler krever litt ekstra trinn (er), men er også ganske gjennomførbare.

likevel er DET enkleste alternativet VÅRT Spss Create Dummy Variables-Verktøy, da det tar perfekt vare på alt.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.