Imputação múltipla para dados em falta

imputação múltipla para dados em falta é um método atraente para o tratamento de dados em falta na análise multivariada. A ideia de imputação múltipla de dados em falta foi proposta pela primeira vez por Rubin (1977).

Procedimento

A seguir está o procedimento para a realização de imputação múltipla, por falta de dados que foi criado por rick Rubin, em 1987:

  • A primeira etapa de imputação múltipla para os dados em falta é imputar a falta de valores utilizando um modelo apropriado, que incorpora a variação aleatória.
  • o segundo passo de imputação múltipla para dados em falta é repetir o primeiro passo 3-5 vezes.
  • o terceiro passo de imputação múltipla para dados em falta é realizar a análise desejada em cada conjunto de dados usando métodos de dados completos padrão.
  • o quarto passo da imputação múltipla dos dados em falta é a média dos valores dos parâmetros estimados através das amostras de valores em falta, a fim de obter uma única estimativa pontual.
  • O quinto passo de imputação múltipla de dados em falta é calcular os erros-padrão calculando a média dos erros-padrão ao quadrado das estimativas de valor em falta. Depois disso, o pesquisador deve calcular a variância do parâmetro de valor em falta entre as amostras. Finalmente, o pesquisador deve combinar as duas quantidades em múltiplas imputações por falta de dados para calcular os erros padrão.

características

imputação múltipla para dados em falta tem várias características desejáveis:

  • imputação múltipla por dados em falta torna possível ao pesquisador obter estimativas aproximadamente imparciais de todos os parâmetros a partir do erro aleatório. O pesquisador não pode alcançar este resultado de imputação determinística, o que a imputação múltipla de dados em falta pode fazer.esta imputação múltipla por dados em falta permite ao investigador obter boas estimativas dos erros-padrão. A imputação múltipla de dados em falta é diferente da imputação única, uma vez que não permite que erros adicionais sejam introduzidos pelo pesquisador.
  • o pesquisador pode realizar múltiplas imputações por dados em falta com qualquer tipo de dados em qualquer tipo de análise, sem software bem equipado.

No entanto, existem certas condições que devem ser satisfeitas antes de realizar múltiplas imputações por dados em falta.

Condições

Condições que devem ser satisfeitas antes de realizar a imputação múltipla para os dados em falta:

  • a primeira condição para A imputação múltipla para a falta de dados é que os dados devem ser falta de forma aleatória. Em outras palavras, a primeira condição para a imputação múltipla de dados em falta afirma que a probabilidade dos dados em falta em uma determinada variável pode depender de outras variáveis observadas, mas não pode depender de si mesma.
  • a segunda condição para a imputação múltipla de dados em falta é que o modelo que é usado pelo pesquisador para imputar os valores deve ser apropriado.
  • a terceira condição para a imputação múltipla de dados em falta é que o modelo que é usado pelo pesquisador deve corresponder com o outro modelo que é usado para a imputação múltipla de dados em falta.

No entanto, o problema é que é muito fácil para o pesquisador violar tais condições ao realizar múltiplas imputações por dados em falta. Isso ocorre porque há casos de imputação múltipla de dados em falta onde os dados não estão faltando aleatoriamente.

A fim de resolver este problema, o pesquisador estima o modelo para os dados que não estão faltando aleatoriamente. Mas tais modelos são complexos e indescritíveis, e, portanto, requerem algum software bem equipado para executar.

outra coisa que o pesquisador deve ter em mente é que se “faltando ao acaso” é satisfeito, então as estimativas imparciais obtidas por imputação múltipla para dados em falta nem sempre são fáceis de interpretar.

páginas relacionadas:

  • valores em falta nos dados

Deixe uma resposta

O seu endereço de email não será publicado.