このページでは、summarizeコマンドを使用して記述統計を取得する例と、出力を説明する脚注を示します。 最初の例では、femaleと呼ばれる0/1(ダミー)変数の記述統計量を取得します。 この変数は、学生が女性の場合は1、それ以外の場合は0にコード化されます。 2番目の例では、writeと呼ばれる連続変数の記述統計を取得します。writeは、学生が筆記テストで受け取ったスコアです。 詳細オプションを使用して、百分位数、歪度、尖度などの追加情報を取得します。 すべての連続変数でdetailオプションを使用する必要はありません。P>
use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1
A.Variable–この列は、どの変数が記述されているかを示します。 Summarizeコマンドの後に複数の変数をリストすることができます。
b.Obs–この列には、有効な観測値(またはケース)の数が表示されます(つまり、次のようになります)。 その変数のために、欠落していません)。 データセットに200個の観測値があったが、変数femaleに10個の欠損値があった場合、この列の数値は190になります。
c.Mean–これは変数の平均です。 この場合、変数femaleの範囲は0から1(最小値と最大値)であるため、平均は実際には1としてコード化された観測値の割合です。
d.Std. デヴ -これは変数の標準偏差です。 これは、変数の分布の広がりに関する情報を提供します。 p>
summarize write, detail
writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527
e.1%–これは最初の百分位数です。 百分位数は、変数の値を最低から最高に順序付けてから、関心のあるパーセント(この場合は1%)に対応する値を見つけることによって計算されます。 したがって、変数writeの値の1%が31以下になります。25%–これは25番目の百分位数で、最初の四分位数としても知られています。
f.25%-これは25番目の百分位数であり、最初の四分位数としても知ら
g.50%–これは50番目の百分位数であり、中央値とも呼ばれます。 変数の値を最低から最高に順序付けると、中央値は正確に中央の値になります。 言い換えれば、値の半分は中央値を下回り、半分は上になります。 変数に外れ値がある場合、これは中心傾向の良い尺度です。
h.75%–これは75番目の百分位数であり、3番目の四分位数としても知られています。
I.Smallest–これは変数の4つの最小値のリストです。 この例では、4つの最小値はすべて31です。
j.Largest–これは、変数の4つの最大値のリストです。 この例では、4つの最大値はすべて67です。b.Obs–この列は、その変数に対して有効であった(つまり、欠落していない)観測値(またはケース)の数を示します。 データセットに200個の観測値があったが、変数femaleに10個の欠損値があった場合、この列の数値は190になります。Wgtの合計。 -これは重みの合計です。 Stataでは、データにさまざまな種類の重みを使用できます。 デフォルトでは、各ケース(すなわち、被験者)には1の重みが与えられます。 この既定値を使用すると、重みの合計は観測値の数に等しくなります。
c.Mean–これは観測値全体の算術平均です。 これは、中心的傾向の最も広く使用されている尺度です。 それは一般的に平均と呼ばれています。 平均値は、非常に大きい値または小さい値に敏感です。
d.Std. デヴ -これは変数の標準偏差です。 これは、変数の分布の広がりに関する情報を提供します。 分散–これは標準偏差の二乗です(つまり、2乗に上昇します)。 また、分布の広がりの尺度でもあります。Skewness–Skewnessは非対称性の程度と方向を測定します。
m.Skewness-Skewnessは非対称性の程度と方向を測定します。 正規分布などの対称分布の歪度は0であり、平均値が中央値より小さい場合など、左に歪む分布の歪度は負です。尖度-尖度は、分布の裾の重さの尺度です。 正規分布の尖度は3です。 重い尾の分布は尖度が3より大きく、軽い尾の分布は尖度が3より小さい。