Beskrivende statistikk ved hjelp av kommandoen oppsummer / Stata Annotert Utdata

Denne siden viser et eksempel på å hente beskrivende statistikk ved hjelp av kommandoen oppsummer med fotnoter som forklarer utdata. I det første eksemplet får vi beskrivende statistikk for en 0/1 (dummy) variabel kalt kvinne. Denne variabelen er kodet 1 hvis studenten var kvinne, og 0 ellers. I det andre eksemplet får vi beskrivende statistikk for en kontinuerlig variabel kalt skrive, som var poengsummen studentene mottok på en skriveprøve. Vi bruker detaljalternativet for å få ytterligere informasjon, inkludert prosentiler, skjevhet og kurtose. Du trenger ikke å bruke detaljalternativet med alle kontinuerlige variabler.

use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
 Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1

A. Variabel-denne kolonnen angir hvilken variabel som beskrives. Du kan liste mer enn en variabel etter oppsummer-kommandoen; når du gjør det, vil du se hver variabel på sin egen linje av utgangen.

B. Obs – denne kolonnen forteller deg antall observasjoner (eller tilfeller) som var gyldige (dvs. mangler ikke) for den variabelen. Hvis du hadde 200 observasjoner i datasettet ditt, men du hadde 10 manglende verdier for variabelen kvinne, ville tallet i denne kolonnen være 190.

c. Mean-Dette er gjennomsnittet av variabelen. I dette tilfellet varierer vår variable kvinne fra 0 til 1 (min og maks verdier), så gjennomsnittet er faktisk andelen observasjoner kodet som 1.

D.Std. Dev. – Dette er standardavviket tilvariabel. Dette gir informasjon om spredningen av fordelingenav variabelen.

summarize write, detail
 writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527

e. 1% – dette er den første persentilen. Prosentiler beregnes ved å bestille verdiene til en variabel fra laveste til høyeste, og deretter finne verdien som tilsvarer hvilken prosent du er interessert i, i dette tilfellet 1%. Derfor er 1% av verdiene til variabelen skrive lik eller mindre enn 31.

f. 25% – Dette er den 25. persentilen, også kjent som den første kvartilen.

g. 50% – dette er den 50. persentilen, også kjent som medianen. Hvis du bestiller verdiene av variabelen fra laveste til høyeste, vil medianen være verdien nøyaktig i midten. Med andre ord vil halvparten av verdiene være under medianen, og halvparten vil være over. Dette er et godt mål på sentral tendens hvis variabelen har uteliggere.

h. 75% – dette er den 75. persentilen, også kjent som tredje kvartil.Minste-Dette er en liste over de fire minste verdiene til variabelen. I dette eksemplet er de fire minste verdiene alle 31.

J. Største-dette er en liste over de fire største verdiene av variabelen. I dette eksemplet er de fire største verdiene alle 67.Obs-denne kolonnen forteller deg antall observasjoner (eller tilfeller) som var gyldige (dvs.ikke mangler) for den variabelen. Hvis du hadde 200 observasjoner i datasettet ditt, men du hadde 10 manglende verdier for variabelen kvinne, ville tallet i denne kolonnen være 190.

K. Sum Av Wgt. – Dette er summen av vektene. I Stata kan du bruke forskjellige typer vekter på dataene dine. Som standard er hvert tilfelle (dvs. emne) gitt en vekt på 1. Når denne standard brukes, vil summen av vektene være lik antall observasjoner.

C. Mean-Dette er det aritmetiske gjennomsnittet over observasjonene. Det er det mest brukte målet for sentral tendens. Det kalles vanligvis gjennomsnittet. Gjennomsnittet er følsomt for ekstremt store eller små verdier.

D.Std. Dev. – Dette er standardavviket tilvariabel. Dette gir informasjon om spredningen av fordelingenav variabelen.

L. Varians-dette er standardavviket kvadrert(dvs. hevet til den andre effekten). Det er også et mål for spredning av distribusjonen.

m. Skewness-Skewness måler graden og retningen av asymmetri. En symmetrisk fordeling som en normalfordeling har en skjevhet på 0, og en fordeling som er skjev til venstre, for eksempel når gjennomsnittet er mindre enn medianen, har en negativ skjevhet.

n. Kurtosis-Kurtosis er et mål på tyngden av haler av en fordeling. En normalfordeling har en kurtose på 3. Heavy tailed distribusjoner vil ha kurtosis større enn 3 og light tailed distribusjoner vil haekurtosis mindre enn 3.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.