Statistici Descriptive folosind comanda rezumă / ieșire adnotată Stata

această pagină prezintă un exemplu de obținere a statisticilor descriptive folosind comanda rezumă cu note de subsol care explică ieșirea. În primul exemplu, obținem statisticile descriptive pentru o variabilă 0/1 (dummy) numită femeie. Această variabilă este codificată 1 dacă elevul era femeie și 0 altfel. În al doilea exemplu, obținem statisticile descriptive pentru o variabilă continuă numită scriere, care a fost scorul primit de studenți la un test de scriere. Folosim opțiunea de detaliu pentru a obține informații suplimentare, inclusiv percentile, skewness și kurtosis. Nu trebuie să utilizați opțiunea detaliu cu toate variabilele continue.

use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
 Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1

a. variabilă – această coloană indică ce variabilă este descrisă. Puteți lista mai multe variabile după comanda rezuma; atunci când faci, veți vedea fiecare variabilă pe propria linie de ieșire.

b. Obs – această coloană vă indică numărul de observații (sau cazuri) care au fost valide (adică., nu lipsește) pentru acea variabilă. Dacă ați avut 200 de observații în setul de date, dar ați avut 10 valori lipsă pentru variabila femelă, atunci numărul din această coloană ar fi 190.

c. medie – aceasta este media variabilei. În acest caz, variabila noastră femelă variază de la 0 la 1 (valorile min și max), deci media este de fapt proporția de observații codificate ca 1.

d. Std. Dev. – Aceasta este abaterea standard devariabilă. Aceasta oferă informații privind răspândirea distribuțieidin variabilă.

summarize write, detail
 writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527

e. 1% – Aceasta este prima percentilă. Percentilele sunt calculate ordonând valorile unei variabile de la cel mai mic la cel mai mare și apoi găsind valoarea care corespunde procentului care vă interesează, în acest caz, 1%. Prin urmare, 1% din valorile variabilei write sunt egale sau mai mici de 31.

f. 25% – Aceasta este percentila 25, cunoscută și sub numele de prima quartilă.

g. 50% – Aceasta este percentila 50, cunoscută și sub numele de mediană. Dacă ordonați valorile variabilei de la cel mai mic la cel mai mare, mediana ar fi valoarea exact în mijloc. Cu alte cuvinte, jumătate din valori ar fi sub mediană, iar jumătate ar fi mai sus. Aceasta este o măsură bună a tendinței centrale dacă variabila are valori aberante.

h. 75% – aceasta este percentila 75, cunoscută și sub numele de a treia quartilă.

i. cel mai mic – Aceasta este o listă a celor mai mici patru valori ale variabilei. În acest exemplu, cele mai mici patru valori sunt toate 31.

j. cel mai mare – aceasta este o listă a celor mai mari patru valori ale variabilei. În acest exemplu, cele mai mari patru valori sunt toate 67.

b. Obs – această coloană vă indică numărul de observații (sau cazuri) care au fost valide (adică nu lipsesc) pentru acea variabilă. Dacă ați avut 200 de observații în setul de date, dar ați avut 10 valori lipsă pentru variabila femelă, atunci numărul din această coloană ar fi 190.

k. suma Wgt. – Aceasta este suma greutăților. În Stata, puteți utiliza diferite tipuri de greutăți pe datele dvs. În mod implicit, fiecărui caz (adică subiect) i se acordă o greutate de 1. Când se utilizează această valoare implicită, suma ponderilor va fi egală cu numărul de observații.

c. medie – aceasta este media aritmetică a observațiilor. Este cea mai utilizată măsură a tendinței centrale. Se numește în mod obișnuit media. Media este sensibilă la valori extrem de mari sau mici.

d. Std. Dev. – Aceasta este abaterea standard devariabilă. Aceasta oferă informații privind răspândirea distribuțieidin variabilă.

L. varianță – aceasta este deviația standard pătrată (adică ridicată la a doua putere). Este, de asemenea, o măsură de răspândire a distribuției.

m. Skewness – Skewness măsoară gradul și direcția asimetriei. O distribuție simetrică, cum ar fi o distribuție normală, are o înclinare de 0, iar o distribuție care este înclinată spre stânga, de exemplu, atunci când media este mai mică decât mediana, are o înclinare negativă.

n. Kurtosis – Kurtosis este o măsură a greutății cozilor unei distribuții. O distribuție normală are o kurtoză de 3. Distribuțiile cu coadă grea vor avea kurtosis mai mare de 3, iar distribuțiile cu coadă ușoară vor havekurtosis mai puțin de 3.

Lasă un răspuns

Adresa ta de email nu va fi publicată.