Esta página muestra un ejemplo de cómo obtener estadísticas descriptivas usando el comando resumir con notas al pie de página que explican el resultado. En el primer ejemplo, obtenemos las estadísticas descriptivas para una variable 0/1 (ficticia) llamada hembra. Esta variable se codifica 1 si el estudiante es mujer, y 0 si no. En el segundo ejemplo, obtenemos las estadísticas descriptivas de una variable continua llamada escritura, que fue la puntuación que los estudiantes recibieron en una prueba de escritura. Utilizamos la opción de detalles para obtener información adicional, incluidos percentiles, asimetría y curtosis. No es necesario utilizar la opción detalle con todas las variables continuas.
use https://stats.idre.ucla.edu/stat/stata/notes/hsb2(highschool and beyond (200 cases))
summarize female
Variablea| Obsb Meanc Std. Dev.d Mine Maxf-------------+-------------------------------------------------------- female | 200 .545 .4992205 0 1
a. Variable: Esta columna indica qué variable se está describiendo. Puede enumerar más de una variable después del comando resumir; cuando lo haga, verá cada variable en su propia línea de la salida.
b. Obs: Esta columna indica el número de observaciones (o casos) que fueron válidas (es decir,, no falta) para esa variable. Si tiene 200 observaciones en su conjunto de datos, pero tiene 10 valores faltantes para la variable female, entonces el número en esta columna sería 190.
c. Media-Esta es la media de la variable. En este caso, nuestra variable femenina varía de 0 a 1 (los valores mínimo y máximo), por lo que la media es en realidad la proporción de observaciones codificadas como 1.
d. Std. Dev. – Esta es la desviación estándar de la variable. Esto proporciona información sobre la extensión de la distribución de la variable.
summarize write, detail
writing score------------------------------------------------------------- Percentiles Smallesti 1%e 31 31 5% 35.5 3110% 39 31 Obsb 20025%f 45.5 31 Sum of Wgt.k 200
50%g 54 Meanc 52.775 Largestj Std. Dev.d 9.47858675%h 60 6790% 65 67 Variancel 89.8435995% 65 67 Skewnessm -.478415899% 67 67 Kurtosisn 2.238527
correo. 1% – Este es el primer percentil. Los percentiles se calculan ordenando los valores de una variable de menor a mayor, y luego encontrando el valor que corresponde al porcentaje que le interesa, en este caso, el 1%. Por lo tanto, el 1% de los valores de la variable write son iguales o inferiores a 31.
f. 25% – Este es el percentil 25, también conocido como el primer cuartil.
g. 50% – Este es el percentil 50, también conocido como la mediana. Si ordena los valores de la variable de menor a mayor, la mediana sería el valor exactamente en el medio. En otras palabras, la mitad de los valores estaría por debajo de la mediana y la otra mitad por encima. Esta es una buena medida de tendencia central si la variable tiene valores atípicos.
h. 75% – Este es el percentil 75, también conocido como el tercer cuartil.
i. Smallest – Esta es una lista de los cuatro valores más pequeños de la variable. En este ejemplo, los cuatro valores más pequeños son 31.
j. Largest – Esta es una lista de los cuatro valores más grandes de la variable. En este ejemplo, los cuatro valores más grandes son los 67.
b. Obs – Esta columna le indica el número de observaciones (o casos) que eran válidas (es decir, que no faltaban) para esa variable. Si tiene 200 observaciones en su conjunto de datos, pero tiene 10 valores faltantes para la variable female, entonces el número en esta columna sería 190.
k. Suma de Wgt. – Esta es la suma de los pesos. En Stata, puede utilizar diferentes tipos de ponderaciones en sus datos. Por defecto, a cada caso (es decir, sujeto) se le da un peso de 1. Cuando se usa este valor predeterminado, la suma de los pesos será igual al número de observaciones.
c. Media – Esta es la media aritmética de las observaciones. Es la medida de tendencia central más utilizada. Es comúnmente llamado el promedio. La media es sensible a valores extremadamente grandes o pequeños.
d. Std. Dev. – Esta es la desviación estándar de la variable. Esto proporciona información sobre la extensión de la distribución de la variable.
l. Varianza – Esta es la desviación estándar al cuadrado (es decir, elevada a la segunda potencia). También es una medida de propagación de la distribución.
m. Asimetría: La asimetría mide el grado y la dirección de la asimetría. Una distribución simétrica, como una distribución normal, tiene una asimetría de 0, y una distribución sesgada hacia la izquierda, por ejemplo, cuando la media es menor que la mediana, tiene una asimetría negativa.
n. Curtosis-La curtosis es una medida de la pesadez de las colas de una distribución. Una distribución normal tiene una curtosis de 3. Las distribuciones de cola pesada tendrán curtosis mayor que 3 y las distribuciones de cola ligera tendrán curtosis menor que 3.