hur man skapar Dummyvariabler i SPSS?

Du kan inte enkelt använda kategoriska variabler som prediktorer i linjär regression: du måste bryta upp dem i dikotomvariabler som kallas dummyvariabler.
det perfekta sättet att skapa dessa är vår dummy variabler verktyg. Om du inte vill använda det här verktyget visar den här handledningen rätt sätt att göra det manuellt.

  • exempel i – någon numerisk variabel
  • exempel II – Numerisk variabel med intilliggande heltal
  • exempel III – Strängvariabel med konvertering
  • exempel IV-Strängvariabel utan konvertering

exempel datafil

denna handledning använder personal.sav hela. En del av denna datafil visas nedan.

SPSS Staff Data View

exempel i – någon numerisk variabel

Låt oss först skapa dummyvariabler för marit, kort för civilstånd. Vårt första steg är att köra en grundläggande frekvenstabell medfrekvenser marit.Tabellen nedan visar den resulterande tabellen.

skapa Dummyvariabler i SPSS-frekvenser Marit

Så hur man bryter upp civilstånd i dummyvariabler? För det första utelämnar vi alltid en kategori, referenskategorin. Du kan välja vilken kategori som referenskategori.

så för det här exemplet väljer vi 5 (Änka). Detta innebär att vi skapar 3 dummyvariabler som representerar kategorierna 1, 2 och 4 (Observera att 3 inte förekommer i denna variabel).

syntaxen nedan visar hur du skapar och märker våra 3 dummyvariabler. Vi kör det.

*skapa dummyvariabler för kategorierna 1, 2 och 4.
beräkna marit_1 = (marit = 1).
beräkna marit_2 = (marit = 2).
beräkna marit_4 = (marit = 4).
*applicera variabla etiketter på dummyvariabler.
variabla etiketter
marit_1 ’civilstånd = aldrig gift’
marit_2 ’civilstånd = för närvarande gift ’
marit_4’civilstånd = Skild’.
*snabbkontroll första dummy variabel
frekvenser marit_1.

resultat

först och främst, notera att vi skapade 3 snyggt märkta dummyvariabler i vår aktiva dataset.

SPSS skapa Dummyvariabler resultat 1

tabellen nedan visar frekvensfördelningen för vår första dummyvariabel.

frekvenstabell Dummy variabel

Observera att vår dummy variabel har 3 distinkta värden:

  • respondenter vars civilstånd inte är” aldrig gift ”poäng 0;
  • respondenter vars civilstånd är” aldrig gift ” poäng 1;
  • respondenter vars civilstånd är ett saknat värde (och därför okänt) har ett system som saknas värde.

Vi kan nu kontrollera resultaten mer noggrant genom att köra crosstabs marit av marit_1 till marit_4.Om du gör det skapas 3 beredskapstabeller, varav den första visas nedan.

SPSS skapa Dummy variabler kontrollera resultat 1

på vår dummy variabel,
respondenter som har andra civilstånd än” aldrig gift”alla poäng 0;
respondenter som ”aldrig gift” alla poäng 1;
vi har en provstorlek på N = 170 (denna tabell innehåller endast respondenter utan att sakna värden på någon variabel).

alternativt är en slutlig-mycket noggrann-kontroll att jämföra ANOVA-resultat för den ursprungliga variabeln till regressionsresultat med hjälp av våra dummyvariabler. Syntaxen nedan gör just det, med månadslön som den beroende variabeln.

*Minimal regression med dummyvariabler.
regression
/ beroende lön
/ metod ange marit_1 till marit_4.
*Minimal ANOVA med originalvariabel.
oneway lön av marit.

Observera att båda analyserna resulterar i identiska ANOVA-tabeller. Vi kommer att diskutera ANOVA versus dummy variabel regression mer noggrant i en framtida handledning.

exempel II-Numerisk variabel med intilliggande heltal

Vi skapar nu dummyvariabler för region. Återigen börjar vi med att inspektera en minimal frekvenstabell som vi skapar genom att köra frekvensregion.Detta resulterar i tabellen nedan.

skapa Dummyvariabler i SPSS-frekvensområdet

vi väljer 1 (”norr”) som vår referenskategori. Vi skapar därför dummyvariabler för kategorierna 2 till 5. Eftersom dessa är intilliggande heltal kan vi påskynda saker genom att använda do REPEAT som visas nedan.

*skapa dummyvariabler för regionkategorierna 2 till 5.
upprepa #vals = 2 till 5 / #vars = region_2 till region_5.
recode region (#vals = 1)(lo thru hi = 0) till #vars.
avsluta upprepa utskrift.
*applicera variabla etiketter på nya variabler.
variabla etiketter
region_2 ’Region = Öst’
region_3′ Region = Syd ’
region_4′ Region = Väst ’
region_5’Region = topp 4 Stad’.
*snabb kontroll.
korstabeller region efter region_2 till region_5.

en noggrann inspektion av de resulterande tabellerna bekräftar att alla resultat är korrekta.

exempel III-Strängvariabel med konvertering

tyvärr fungerar våra första 2-metoder inte för strängvariabler som jtype-kort för ”Jobbtyp”). Den enklaste lösningen är att konvertera den till en numerisk variabel som diskuteras i SPSS konvertera sträng till Numerisk variabel. Syntaxen nedan använder AUTORECODE för att få jobbet gjort.

*konvertera jtype till numerisk variabel.
autorecode jtype
/till njtype.
*kontrollera resultatet.
frekvenser njtype.
*ange saknade värden.
saknade värden njtype (1,2).
* kontrollera resultatet igen.
frekvenser njtype.

resultat

SPSS skapa Dummyvariabler frekvenstabell Njtype

eftersom njtype-kort för” numerisk Jobbtyp ” – är en numerisk variabel, kan vi nu använda metod i eller metod II för att bryta upp det i dummyvariabler.

exempel IV-Strängvariabel utan konvertering

konvertera strängvariabler till numeriska är det enkelt att skapa dummyvariabler för dem. Utan denna omvandling är processen besvärlig eftersom SPSS inte hanterar saknade värden för strängvariabler korrekt. Syntaxen nedan får dock jobbet gjort korrekt.

*kontrollera frekvenser.
frekvenser jtype.
*chans ’ (okänd) ’till’NA’.
recode jtype (’(okänd)’ = ’NA’).
*Ställ in användarens saknade värden.
saknade värden jtype (”,’NA’).
*Återinspektera frekvenser.
frekvenser jtype.
*skapa dummyvariabler för strängvariabel.
om(saknas inte (jtype)) jtype_1 = (jtype = ’IT’).
om (saknas inte (jtype)) jtype_2 = (jtype = ’hantering’).
om (saknas inte (jtype)) jtype_3 = (jtype = ’försäljning’).
om(saknas inte (jtype)) jtype_4 = (jtype = ’personal’).
*applicera variabla etiketter på dummyvariabler.
variabla etiketter
jtype_1 ’Jobbtyp = det’
jtype_2 ’Jobbtyp = hantering’
jtype_3 ’Jobbtyp = försäljning’
jtype_4’Jobbtyp = personal’.
*kontrollera resultat.korstabeller jtype av jtype_1 till jtype_4 .

slutliga anteckningar

skapa dummyvariabler för numeriska variabler kan göras snabbt och enkelt. Att ställa in korrekta variabla etiketter tar dock alltid lite arbete. Strängvariabler kräver lite extra steg men är också ganska genomförbara.

ändå är det enklaste alternativet vårt SPSS Create Dummy Variables Tool eftersom det tar perfekt hand om allt.

Lämna ett svar

Din e-postadress kommer inte publiceras.