Es importante comprender el concepto de valores faltantes para administrar los datos con éxito. Si los valores faltantes no son manejados adecuadamente por el investigador, entonces él/ella puede terminar dibujando una inferencia inexacta sobre los datos. Debido a un manejo inadecuado, el resultado obtenido por el investigador diferirá de aquellos en los que están presentes los valores faltantes.
La falta de respuesta al ítem ocurre cuando el encuestado no responde a ciertas preguntas debido al estrés, la fatiga o la falta de conocimiento. Es posible que el encuestado no responda porque algunas preguntas son delicadas. Esta falta de respuestas se considerarían valores faltantes.
Manejo de valores faltantes
El investigador puede dejar los datos o hacer imputación de datos para reemplazarlos. Supongamos que el número de casos de valores faltantes es extremadamente pequeño; entonces, un investigador experto puede omitir u omitir esos valores del análisis. En lenguaje estadístico, si el número de casos es inferior al 5% de la muestra, el investigador puede eliminarlos.
En el caso del análisis multivariado, si hay un mayor número de valores faltantes, entonces puede ser mejor eliminar esos casos (en lugar de hacer imputación) y reemplazarlos. Por otro lado, en el análisis univariado, la imputación puede disminuir la cantidad de sesgo en los datos, si los valores faltan al azar.
Hay dos formas de forma aleatoria los valores que faltan:
- MCAR: Falta completamente al azar
- MAR: Falta al azar
La primera forma es la que falta completamente al azar (MCAR). Esta forma existe cuando los valores faltantes se distribuyen aleatoriamente entre todas las observaciones. Este formulario se puede confirmar dividiendo los datos en dos partes: un conjunto que contiene los valores que faltan y el otro que contiene los valores que no faltan. Después de dividir los datos, se realiza la prueba más popular, llamada prueba t de diferencia de medias, para verificar si existe alguna diferencia en la muestra entre los dos conjuntos de datos.
El investigador debe tener en cuenta que si los datos son MCAR, entonces puede elegir una eliminación por pares o una eliminación por listas de los casos de valor faltantes. Sin embargo, si los datos no son MCAR, se realiza la imputación para reemplazarlos.
Falta la segunda forma al azar (MAR). En MAR, los valores faltantes no se distribuyen aleatoriamente entre las observaciones, sino que se distribuyen dentro de una o más submuestras. Esta forma es más común que la anterior.
El valor faltante no ignorable es la forma más problemática que involucra aquellos tipos de valores faltantes que no se distribuyen aleatoriamente a través de las observaciones. En este caso, la probabilidad no se puede predecir a partir de las variables del modelo. Esto se puede ignorar realizando imputación de datos para reemplazarlos.
Existen métodos de estimación en SPSS que proporcionan al investigador ciertas técnicas estadísticas para estimar los valores faltantes. Estos son, a saber, regresión, estimación de máxima verosimilitud, eliminación en listas o pares, bootstrap bayesiano aproximado, imputación de datos múltiples y muchos otros.