Description statistics using the summar command | Stata Annotated Output

This page shows a example of Get deskriptiivinen statistics using the summar command with alaviitteet explaining the output. Ensimmäisessä esimerkissä saadaan kuvaileva tilasto 0/1 (dummy) – muuttujalle nimeltä nainen. Tämä muuttuja merkitään koodilla 1, Jos opiskelija oli nainen, ja koodilla 0 muutoin. Toisessa esimerkissä saadaan kuvaileva tilasto jatkuvalle muuttujalle write, joka oli oppilaiden kirjoituskokeessa saama pistemäärä. Käytämme detail-vaihtoehtoa saadaksemme lisätietoja, mukaan lukien prosenttipisteet, skewness ja kurtosis. Sinun ei tarvitse käyttää detail-vaihtoehtoa kaikkien jatkuvien muuttujien kanssa.

use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
 Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1

a. muuttuja – tämä sarake kertoo, mitä muuttujaa kuvataan. Voit luetella useamman kuin yhden muuttujan summar-komennon jälkeen; kun teet sen, näet jokaisen muuttujan omalla lähdön rivillään.

b. Obs – tämä sarake kertoo pätevien havaintojen (tai tapausten) määrän (ts., ei puutu), että muuttuja. Jos tietokokonaisuudessasi olisi 200 havaintoa, mutta muuttujan naaraan osalta puuttuvia arvoja olisi 10, Tämän sarakkeen luku olisi 190.

c. keskiarvo – tämä on muuttujan keskiarvo. Tässä tapauksessa muuttuva naaraamme vaihtelee 0: sta 1: een (min-ja max-arvot), joten keskiarvo on todellisuudessa havaintojen osuus koodattuna 1: ksi.

d. sukupuolitauti. Dev. – Tämä on keskihajonta thevariable. Näin saadaan tietoa muuttujan jakauman jakautumisesta.

summarize write, detail
 writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527

e. 1% – Tämä on ensimmäinen prosenttipiste. Prosenttipisteet lasketaan tilaamalla muuttujan arvot alimmasta korkeimpaan ja sitten etsimällä arvo, joka vastaa mitä tahansa prosenttia olet kiinnostunut, tässä tapauksessa 1%. Näin ollen 1% muuttujan kirjoitusarvoista on yhtä suuri tai pienempi kuin 31.

f. 25% – Tämä on 25.prosenttipiste, joka tunnetaan myös nimellä ensimmäinen kvartiili.

g. 50% – tämä on 50.prosenttipiste, joka tunnetaan myös mediaanina. Jos järjestät muuttujan arvot alimmasta korkeimpaan, mediaani olisi arvo täsmälleen keskellä. Toisin sanoen puolet arvoista olisi mediaanin alapuolella ja puolet sen yläpuolella. Tämä on hyvä keskitaipumuksen mitta, jos muuttujalla on poikkeavia arvoja.

h. 75% – tämä on 75.prosenttipiste, joka tunnetaan myös nimellä kolmas kvartiili.

i. pienin – tämä on luettelo muuttujan neljästä pienimmästä arvosta. Tässä esimerkissä neljä pienintä arvoa ovat kaikki 31.

j. suurin – tämä on luettelo muuttujan neljästä suurimmasta arvosta. Tässä esimerkissä neljä suurinta arvoa ovat kaikki 67.

b. Obs – tämä sarake kertoo, kuinka monta havaintoa (tai tapausta) kyseiselle muuttujalle oli voimassa (eli ei puuttunut). Jos tietokokonaisuudessasi olisi 200 havaintoa, mutta muuttujan naaraan osalta puuttuvia arvoja olisi 10, Tämän sarakkeen luku olisi 190.

k. Wgt: n summa. – Tämä on painojen summa. Statassa voit käyttää erilaisia painoja tiedoillesi. Oletusarvoisesti jokaiselle tapaukselle (eli subjektille) annetaan painoarvo 1. Tätä oletusarvoa käytettäessä painojen summa vastaa havaintojen määrää.

c. keskiarvo – tämä on havaintojen aritmeettinen keskiarvo. Se on yleisimmin käytetty keskusjohtoisuuden mitta. Sitä kutsutaan yleisesti keskiarvoksi. Keskiarvo on herkkä erittäin suurille tai pienille arvoille.

d. sukupuolitauti. Dev. – Tämä on keskihajonta thevariable. Näin saadaan tietoa muuttujan jakauman jakautumisesta.

L. varianssi – tämä on keskihajonta potenssiin (eli nostetaan toiseen potenssiin). Se on myös levinneisyyden mitta.

m. vinous – vinous mittaa epäsymmetrian astetta ja suuntaa. Symmetrisellä jakaumalla, kuten normaalijakaumalla, on skewness 0, ja jakaumalla, joka on vinoutunut vasemmalle, esimerkiksi kun keskiarvo on pienempi kuin mediaani, on negatiivinen skewness.

n. kurtoosi – kurtoosi on jakauman häntien painon mitta. Normaalijakauman kurtoosi on 3. Heavy tailed distributions will have kurtosis greater than 3 and light tailed distributions will havekurtosis less than 3.

Vastaa

Sähköpostiosoitettasi ei julkaista.