Valores em falta nos dados

o conceito de valores em falta é importante de compreender para gerir com sucesso os dados. Se os valores em falta não são tratados corretamente pelo pesquisador, então ele/ela pode acabar desenhando uma inferência imprecisa sobre os dados. Devido a um tratamento inadequado, o resultado obtido pelo pesquisador será diferente daqueles onde os valores em falta estão presentes.

Item não-resposta ocorre quando o respondente não responde a certas perguntas devido a estresse, fadiga ou falta de conhecimento. O inquirido pode não responder porque algumas perguntas são sensíveis. Esta falta de respostas seria considerada falta de valores.o investigador pode deixar os dados ou fazer a imputação dos dados para os substituir. Suponha que o número de casos de valores em falta é extremamente pequeno; então, um pesquisador especialista pode cair ou omitir esses valores da análise. Em linguagem estatística, se o número de casos for inferior a 5% da amostra, então o pesquisador pode abandoná-los.

no caso de análise multivariada, se houver um maior número de valores em falta, então pode ser melhor largar esses casos (em vez de fazer imputação) e substituí-los. Por outro lado, em análise univariada, a imputação pode diminuir a quantidade de viés nos dados, se os valores estão faltando aleatoriamente.

existem duas formas de valores em falta aleatoriamente:

  • MCAR: em falta completamente ao acaso
  • MAR: em falta ao Aleatório

a primeira forma está em falta completamente ao acaso (MCAR). Este formulário existe quando os valores em falta são distribuídos aleatoriamente em todas as observações. Este formulário pode ser confirmado dividindo os dados em duas partes: um conjunto contendo os valores em falta e o outro contendo os valores não em falta. Depois de particionar os dados, o teste mais popular, chamado o teste t da diferença média, é realizado a fim de verificar se existe alguma diferença na amostra entre os dois conjuntos de dados.

O pesquisador deve ter em mente que se os dados são MCAR, então ele pode escolher uma par-wise ou uma eliminação list-wise de casos de valores em falta. Se, no entanto, os dados não são MCAR, então a imputação para substituí-los é realizada.

A segunda forma está ausente aleatoriamente (MAR). Em MAR, os valores em falta não são distribuídos aleatoriamente entre as observações, mas são distribuídos dentro de uma ou mais subamostras. Esta forma é mais comum do que a anterior.

o valor em falta não ignorável é a forma mais problemática que envolve os tipos de valores em falta que não são distribuídos aleatoriamente pelas observações. Neste caso, a probabilidade não pode ser prevista a partir das variáveis do modelo. Isso pode ser ignorado através da realização de imputação de dados para substituí-los.existem métodos de estimativa em SPSS que fornecem ao investigador certas técnicas estatísticas para estimar os valores em falta. Trata-se de regressão, estimativa máxima de probabilidade, exclusão em relação a lista ou par, bootstrap Bayesiana aproximada, imputação de dados múltiplos, e muitos outros.

Deixe uma resposta

O seu endereço de email não será publicado.