Ez az oldal példát mutat a leíró statisztikák megszerzésére az összefoglalás paranccsal, a kimenetet magyarázó lábjegyzetekkel. Az első példában a female nevű 0/1 (dummy) változó leíró statisztikáit kapjuk. Ezt a változót 1 kódolja, ha a hallgató nő volt, egyébként pedig 0. A második példában az írásnak nevezett folyamatos változó leíró statisztikáit kapjuk, amely az írási teszten kapott pontszám volt. A részlet opcióval további információkat kapunk, beleértve a percentiliseket, a ferdeséget és a kurtózist. Nem kell a részlet opciót használni az összes folyamatos változóval.
use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1
a. változó – ez az oszlop jelzi, hogy melyik változót írják le. Az összegzés parancs után egynél több változót is felsorolhat; amikor ezt megteszi, minden változót a kimenet saját sorában fog látni.
b. Obs-ez az oszlop megmutatja az érvényes megfigyelések (vagy esetek) számát (azaz., nem hiányzik) az adott változóhoz. Ha 200 megfigyelése volt az adatkészletben, de 10 hiányzó értéke volt a női változóhoz, akkor ebben az oszlopban a szám 190 lenne.
C. átlag – ez a változó átlaga. Ebben az esetben a változó nő 0-tól 1-ig terjed (a min és max értékek), tehát az átlag valójában az 1-ként kódolt megfigyelések aránya.
D. Std. Dev. – Ez a szórásváltozó. Ez információt nyújt az eloszlás terjedésérőla változó.
summarize write, detail
writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527
e. 1% – Ez az első percentilis. A százalékokat úgy számítják ki, hogy egy változó értékeit a legalacsonyabbtól a legmagasabbig rendezik, majd megtalálják azt az értéket, amely megfelel az Önt érdeklő százaléknak, ebben az esetben 1% – nak. Ezért az írási változó értékeinek 1% – A egyenlő vagy kevesebb, mint 31.
f. 25% – Ez a 25.percentilis, más néven az első kvartilis.
g. 50% – Ez az 50.percentilis, más néven medián. Ha a változó értékeit a legalacsonyabbtól a legmagasabbig rendeli, akkor a medián pontosan a középső érték lenne. Más szavakkal, az értékek fele a medián alatt, a fele pedig a felett lenne. Ez a központi tendencia jó mértéke, ha a változónak vannak kiugró értékei.
h. 75% – ez a 75.percentilis, más néven harmadik kvartilis.
i. legkisebb-ez a változó négy legkisebb értékének listája. Ebben a példában a négy legkisebb érték mind a 31.
J. legnagyobb-Ez a változó négy legnagyobb értékének listája. Ebben a példában a négy legnagyobb érték mind a 67.
b. Obs-ez az oszlop megmutatja az adott változóra érvényes (azaz nem hiányzó) megfigyelések (vagy esetek) számát. Ha 200 megfigyelése volt az adatkészletben, de 10 hiányzó értéke volt a női változóhoz, akkor ebben az oszlopban a szám 190 lenne.
k. a Wgt összege. – Ez a súlyok összege. A Stata – ban különféle súlyokat használhat az adatain. Alapértelmezés szerint minden eset (azaz tárgy) 1-es súlyt kap. Ha ezt az alapértelmezést használjuk, a súlyok összege megegyezik a megfigyelések számával.
C. átlag – ez a megfigyelések számtani átlaga. Ez a központi tendencia legszélesebb körben alkalmazott mértéke. Ezt általában átlagnak nevezik. Az átlag érzékeny a rendkívül nagy vagy kis értékekre.
D. Std. Dev. – Ez a szórásváltozó. Ez információt nyújt az eloszlás terjedésérőla változó.
L. variancia-ez a szórás négyzet (azaz a második teljesítményre emelve). Ez az eloszlás terjedésének mértéke is.
m. Skewness – a Skewness az aszimmetria mértékét és irányát méri. Egy szimmetrikus Eloszlás, mint például a normál eloszlás, ferdesége 0, és egy balra ferde Eloszlás, például ha az átlag kisebb, mint a medián, negatív ferdeséggel rendelkezik.
n. Kurtosis-a Kurtosis az eloszlás farkának súlyosságának mértéke. A normális eloszlás kurtózisa 3. A nehéz farkú eloszlások kurtózisa nagyobb, mint 3, a könnyű farkú eloszlások kurtózisa pedig kevesebb, mint 3.