Summarizeコマンドを使用した記述統計|Stata注釈付き出力

このページでは、summarizeコマンドを使用して記述統計を取得する例と、出力を説明する脚注を示します。最初の例では、femaleと呼ばれる0/1(ダミー)変数の記述統計量を取得します。この変数は、学生が女性の場合は1、それ以外の場合は0にコード化されます。 2番目の例では、writeと呼ばれる連続変数の記述統計を取得します。writeは、学生が筆記テストで受け取ったスコアです。詳細オプションを使用して、百分位数、歪度、尖度などの追加情報を取得します。すべての連続変数でdetailオプションを使用する必要はありません。P>

use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))

summarize female

 Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1

A.Variable–この列は、どの変数が記述されているかを示します。 Summarizeコマンドの後に複数の変数をリストすることができます。

b.Obs–この列には、有効な観測値（またはケース）の数が表示されます（つまり、次のようになります）。その変数のために、欠落していません）。データセットに200個の観測値があったが、変数femaleに10個の欠損値があった場合、この列の数値は190になります。

c.Mean–これは変数の平均です。この場合、変数femaleの範囲は0から1（最小値と最大値）であるため、平均は実際には1としてコード化された観測値の割合です。

d.Std. デヴ -これは変数の標準偏差です。これは、変数の分布の広がりに関する情報を提供します。 p>

summarize write, detail

 writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200

50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527

e.1%–これは最初の百分位数です。百分位数は、変数の値を最低から最高に順序付けてから、関心のあるパーセント（この場合は1％）に対応する値を見つけることによって計算されます。したがって、変数writeの値の1％が31以下になります。25%–これは25番目の百分位数で、最初の四分位数としても知られています。

f.25%-これは25番目の百分位数であり、最初の四分位数としても知ら

g.50%–これは50番目の百分位数であり、中央値とも呼ばれます。変数の値を最低から最高に順序付けると、中央値は正確に中央の値になります。言い換えれば、値の半分は中央値を下回り、半分は上になります。変数に外れ値がある場合、これは中心傾向の良い尺度です。

h.75%–これは75番目の百分位数であり、3番目の四分位数としても知られています。

I.Smallest–これは変数の4つの最小値のリストです。この例では、4つの最小値はすべて31です。

j.Largest–これは、変数の4つの最大値のリストです。この例では、4つの最大値はすべて67です。b.Obs–この列は、その変数に対して有効であった（つまり、欠落していない）観測値（またはケース）の数を示します。データセットに200個の観測値があったが、変数femaleに10個の欠損値があった場合、この列の数値は190になります。Wgtの合計。 -これは重みの合計です。 Stataでは、データにさまざまな種類の重みを使用できます。デフォルトでは、各ケース（すなわち、被験者）には1の重みが与えられます。この既定値を使用すると、重みの合計は観測値の数に等しくなります。

c.Mean–これは観測値全体の算術平均です。これは、中心的傾向の最も広く使用されている尺度です。それは一般的に平均と呼ばれています。平均値は、非常に大きい値または小さい値に敏感です。

d.Std. デヴ -これは変数の標準偏差です。これは、変数の分布の広がりに関する情報を提供します。分散–これは標準偏差の二乗です（つまり、2乗に上昇します）。また、分布の広がりの尺度でもあります。Skewness–Skewnessは非対称性の程度と方向を測定します。

m.Skewness-Skewnessは非対称性の程度と方向を測定します。正規分布などの対称分布の歪度は0であり、平均値が中央値より小さい場合など、左に歪む分布の歪度は負です。尖度-尖度は、分布の裾の重さの尺度です。正規分布の尖度は3です。重い尾の分布は尖度が3より大きく、軽い尾の分布は尖度が3より小さい。

コメントを残す コメントをキャンセル

You may like this....

コメントを残すコメントをキャンセル