esta página mostra um exemplo de obter estatísticas descritivas usando o comando de síntese com notas de rodapé explicando o resultado. No primeiro exemplo, obtemos as estatísticas descritivas de uma variável 0/1 (manequim) chamada feminina. Esta variável é codificada 1 Se o aluno era do sexo feminino, e 0 de outra forma. No segundo exemplo, obtemos as estatísticas descritivas de uma variável contínua chamada write, que foi a pontuação que os estudantes receberam em um teste de escrita. Usamos a opção de detalhes para obter informações adicionais, incluindo percentis, skewness e kurtosis. Você não tem que usar a opção de detalhe com todas as variáveis contínuas.
use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1
um. Variável – Esta coluna indica qual variável está sendo descrito. Você pode listar mais de uma variável após o comando sumariar; quando o fizer, você verá cada variável na sua própria linha do resultado.Obs – esta coluna diz O número de observações (ou casos) que eram válidas (i.e., not missing) for that variable. Se você tivesse 200 observações em seu conjunto de dados, mas você tivesse 10 valores em falta para a variável feminina, então o número nesta coluna seria 190.média-esta é a média da variável. Neste caso, nossa variável feminina varia de 0 a 1 (Os valores min e max), de modo que a média é realmente a proporção de observações codificadas como 1.
D. Std. Desenvolvimento. – Este é o desvio padrão do variável. Isto dá informações sobre a distribuição da variável.
summarize write, detail
writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527
e. 1% – Este é o primeiro percentil. Percentis são calculados ordenando os valores de uma variável do mais baixo ao mais alto, e então encontrando o valor que corresponde a qualquer porcentagem que você está interessado, neste caso, 1%. Assim, 1% dos valores da variável write são iguais ou inferiores a 31.
F. 25% – Este é o percentil 25, Também conhecido como o primeiro quartil. 50% – Este é o percentil 50, também conhecido como mediana. Se você encomendar os valores da variável de baixo para mais alto, a mediana seria o valor exatamente no meio. Em outras palavras, metade dos valores estaria abaixo da mediana, e metade estaria acima. Esta é uma boa medida de tendência central se a variável tem valores anómalos.75% – este é o percentil 75, também conhecido como o terceiro quartil.
I. menor-esta é uma lista dos quatro menores valores da variável. Neste exemplo, os quatro menores valores são todos 31.
J. Largest – esta é uma lista dos quatro maiores valores da variável. Neste exemplo, os quatro maiores valores são todos 67.
B. Obs – esta coluna diz-lhe o número de observações (ou casos) que eram válidas (i.e., não faltando) para essa variável. Se você tivesse 200 observações em seu conjunto de dados, mas você tivesse 10 valores em falta para a variável feminina, então o número nesta coluna seria 190.
K. soma de Wgt. – Esta é a soma dos pesos. Em Stata, você pode usar diferentes tipos de pesos em seus dados. Por padrão, a cada caso (i.e., sujeito) é dado um peso de 1. Quando este padrão é usado, a soma dos pesos será igual ao número de observações.média-esta é a média aritmética ao longo das observações. É a medida mais utilizada de tendência central. É comumente chamado de média. A média é sensível a valores extremamente grandes ou pequenos.
D. Std. Desenvolvimento. – Este é o desvio padrão do variável. Isto dá informações sobre a distribuição da variável. variância-este é o desvio padrão ao quadrado (isto é, elevado à segunda potência). É também uma medida de difusão da distribuição.
m. Skewness-Skewness mede o grau e a direção da assimetria. Uma distribuição simétrica, como uma distribuição normal tem uma assimetria de 0, e uma distribuição é enviesada para a esquerda, por exemplo, quando a média é menor do que a mediana, tem uma assimetria negativa.Kurtosis-Kurtosis é uma medida do peso das caudas de uma distribuição. Uma distribuição normal tem uma kurtosis de 3. Distribuições de cauda pesada terão kurtose maior que 3 e distribuições de cauda leve terão kurtosis menor que 3.