Beskrivande statistik med kommandot sammanfatta / stata kommenterad utgång

den här sidan visar ett exempel på att få beskrivande statistik med kommandot sammanfatta med fotnoter som förklarar utdata. I det första exemplet får vi den beskrivande statistiken för en 0/1 (dummy) variabel som heter female. Denna variabel är kodad 1 Om studenten var kvinnlig och 0 annars. I det andra exemplet får vi den beskrivande statistiken för en kontinuerlig variabel som heter write, vilket var poängen studenter fick på ett skrivtest. Vi använder detaljalternativet för att få ytterligare information, inklusive percentiler, skevhet och kurtos. Du behöver inte använda detaljalternativet med alla kontinuerliga variabler.

use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
 Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1

a. variabel – denna kolumn anger vilken variabel som beskrivs. Du kan lista mer än en variabel efter sammanfattningskommandot; när du gör det ser du varje variabel på sin egen linje i utmatningen.

b. Obs – Denna kolumn talar om antalet observationer (eller fall) som var giltiga (dvs., saknas inte) för den variabeln. Om du hade 200 observationer i din datamängd, men du hade 10 saknade värden för variabeln hona, skulle numret i den här kolumnen vara 190.

C. medelvärde-detta är medelvärdet av variabeln. I det här fallet varierar vår variabla kvinna från 0 till 1 (min-och maxvärdena), så medelvärdet är faktiskt andelen observationer kodade som 1.

d. Std. Dev. – Detta är standardavvikelsen förvariabel. Detta ger information om spridningen av fördelningenav variabeln.

summarize write, detail
 writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527

e. 1% – Detta är den första percentilen. Percentiler beräknas genom att beställa värdena för en variabel från lägsta till högsta och sedan hitta värdet som motsvarar vilken procent du är intresserad av, i det här fallet 1%. Därför är 1% av värdena för variabelskrivningen lika med eller mindre än 31.

f. 25% – Detta är den 25: e percentilen, även känd som den första kvartilen.

g. 50% – Detta är den 50: e percentilen, även känd som medianen. Om du beställer värdena för variabeln från lägsta till högsta, skulle medianen vara värdet exakt i mitten. Med andra ord skulle hälften av värdena vara under medianen och hälften skulle vara över. Detta är ett bra mått på central tendens om variabeln har avvikare.

H. 75% – detta är den 75: e percentilen, även känd som den tredje kvartilen.

i. minsta-det här är en lista över de fyra minsta värdena för variabeln. I det här exemplet är de fyra minsta värdena alla 31.

J. största – Det här är en lista över de fyra största värdena för variabeln. I det här exemplet är de fyra största värdena alla 67.

b. Obs – den här kolumnen anger antalet observationer (eller fall) som var giltiga (dvs. saknas inte) för den variabeln. Om du hade 200 observationer i din datamängd, men du hade 10 saknade värden för variabeln hona, skulle numret i den här kolumnen vara 190.

k. summan av Wgt. – Det här är summan av vikterna. I Stata kan du använda olika typer av vikter på dina data. Som standard ges varje fall (dvs. ämne) en vikt av 1. När denna standard används kommer summan av vikterna att motsvara antalet observationer.

C. Mean-Detta är det aritmetiska medelvärdet över observationerna. Det är det mest använda måttet på central tendens. Det kallas vanligtvis genomsnittet. Medelvärdet är känsligt för extremt stora eller små värden.

d. Std. Dev. – Detta är standardavvikelsen förvariabel. Detta ger information om spridningen av fördelningenav variabeln.

l. varians-Detta är standardavvikelsen kvadrerad (dvs upp till den andra effekten). Det är också ett mått på spridningen av distributionen.

m. Skewness-Skewness mäter graden och riktningen av asymmetri. En symmetrisk fördelning som en normalfördelning har en skevhet på 0, och en fördelning som är skev till vänster, t.ex. när medelvärdet är mindre än medianen, har en negativ skevhet.

n. Kurtosis-Kurtosis är ett mått på svårighetsgraden av en Distributions svansar. En normalfördelning har en kurtos av 3. Tunga tailed distributioner kommer att ha kurtos större än 3 och lätta tailed distributioner kommer att hakurtos mindre än 3.

Lämna ett svar

Din e-postadress kommer inte publiceras.