Beskrivende statistik ved hjælp af kommandoen opsummer | Stata kommenteret Output

denne side viser et eksempel på at få beskrivende statistik ved hjælp af kommandoen opsummer med fodnoter, der forklarer output. I det første eksempel får vi den beskrivende statistik for en 0/1 (dummy) variabel kaldet kvinde. Denne variabel er kodet 1 Hvis den studerende var kvinde, og 0 ellers. I det andet eksempel får vi den beskrivende statistik for en kontinuerlig variabel kaldet skrive, som var den score, studerende modtog på en skrivetest. Vi bruger detaljeringsindstillingen til at få yderligere oplysninger, herunder percentiler, skævhed og kurtose. Du behøver ikke at bruge detaljeindstillingen med alle kontinuerlige variabler.

use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
 Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1

a. variabel – denne kolonne angiver, hvilken variabel der beskrives. Du kan Liste mere end en variabel efter kommandoen opsummer; når du gør det, vil du se hver variabel på sin egen linje i output.

b. Obs-Denne kolonne fortæller dig antallet af observationer (eller tilfælde), der var gyldige (dvs., ikke mangler) for den variabel. Hvis du havde 200 observationer i dit datasæt, men du havde 10 manglende værdier for variablen hun, ville tallet i denne kolonne være 190.

c. middelværdi – dette er gennemsnittet af variablen. I dette tilfælde varierer vores variable kvinde fra 0 til 1 (min og maks værdier), så gennemsnittet er faktisk andelen af observationer kodet som 1.

d.Std. Dev. – Dette er standardafvigelsen afvariabel. Dette giver information om spredningen af distributionen af variablen.

summarize write, detail
 writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527

e. 1% – Dette er den første percentil. Percentiler beregnes ved at bestille værdierne for en variabel fra laveste til højeste og derefter finde den værdi, der svarer til den procent, du er interesseret i, i dette tilfælde 1%. Derfor er 1% af værdierne for variablen skrive lig med eller mindre end 31.

f. 25% – Dette er den 25.percentil, også kendt som den første kvartil.

g. 50% – Dette er den 50.percentil, også kendt som medianen. Hvis du bestiller værdierne for variablen fra laveste til højeste, vil medianen være værdien nøjagtigt i midten. Med andre ord ville halvdelen af værdierne være under medianen, og halvdelen ville være over. Dette er et godt mål for central tendens, hvis variablen har outliers.

h. 75% – Dette er den 75.percentil, også kendt som den tredje kvartil.

i. mindste – Dette er en liste over de fire mindste værdier af variablen. I dette eksempel er de fire mindste værdier alle 31.

J. største – dette er en liste over de fire største værdier af variablen. I dette eksempel er de fire største værdier alle 67.

b. Obs – Denne kolonne fortæller dig antallet af observationer (eller tilfælde), der var gyldige (dvs.ikke mangler) for den variabel. Hvis du havde 200 observationer i dit datasæt, men du havde 10 manglende værdier for variablen hun, ville tallet i denne kolonne være 190.

k. – Dette er summen af vægtene. I Stata kan du bruge forskellige slags vægte på dine data. Som standard gives hvert tilfælde (dvs. emne) en vægt på 1. Når denne standard anvendes, vil summen af vægtene svare til antallet af observationer.

c. Mean – dette er det aritmetiske gennemsnit på tværs af observationerne. Det er det mest anvendte mål for central tendens. Det kaldes almindeligvis gennemsnittet. Middelværdien er følsom over for ekstremt store eller små værdier.

d.Std. Dev. – Dette er standardafvigelsen afvariabel. Dette giver information om spredningen af distributionen af variablen.

l. varians-dette er standardafvigelsen kvadreret (dvs.hævet til anden effekt). Det er også et mål for spredning af distributionen.

m. skævhed-skævhed måler graden og retningen af asymmetri. En symmetrisk fordeling såsom en normalfordeling har en skævhed på 0, og en fordeling, der er skæv til venstre, f.eks. når gennemsnittet er mindre end medianen, har en negativ skævhed.

n. Kurtosis – Kurtosis er et mål for tyngden af halerne i en fordeling. En normal fordeling har en kurtose på 3. Tunge halefordelinger vil have kurtose større end 3 og lette halefordelinger vil have kurtose mindre end 3.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.