Multiple Imputation for Missing Data

Multiple imputation for missing data är en attraktiv metod för hantering av saknade data i multivariat analys. Tanken om multipel imputering för saknade data föreslogs först av Rubin (1977).

procedur

Följande är proceduren för att utföra multipel imputering för saknade data som skapades av Rubin 1987:

  • det första steget med multipel imputering för saknade data är att tillskriva de saknade värdena genom att använda en lämplig modell som innehåller slumpmässig variation.
  • det andra steget i multipel imputering för saknade data är att upprepa det första steget 3-5 gånger.
  • det tredje steget i multipel imputering för saknade data är att utföra önskad analys på varje datamängd med hjälp av standard, kompletta datametoder.
  • det fjärde steget i multipel imputering för saknade data är att genomsnittliga värdena för parameteruppskattningarna över de saknade värdeproverna för att få en enda punktuppskattning.
  • Det femte steget i multipel imputering för saknade data är att beräkna standardfelen genom att i genomsnitt beräkna de kvadrerade standardfelen för de saknade värdeuppskattningarna. Därefter måste forskaren beräkna variansen för den saknade värdeparametern över proverna. Slutligen måste forskaren kombinera de två kvantiteterna i multipel imputering för saknade data för att beräkna standardfelen.

funktioner

multipel imputering för saknade data har flera önskvärda funktioner:

  • multipel imputering för saknade data gör det möjligt för forskaren att erhålla ungefär objektiva uppskattningar av alla parametrar från det slumpmässiga felet. Forskaren kan inte uppnå detta resultat från deterministisk imputering, vilket multipel imputering för saknade data kan göra.
  • denna multipla imputering för saknade data gör det möjligt för forskaren att få bra uppskattningar av standardfelen. Den multipla imputationen för saknade data är till skillnad från enstaka imputation, eftersom det inte tillåter att ytterligare fel införs av forskaren.
  • forskaren kan utföra flera imputeringar för saknade data med någon form av data i någon form av analys, utan välutrustad programvara.

det finns dock vissa villkor som bör uppfyllas innan du utför flera imputeringar för saknade data.

villkor

villkor som bör uppfyllas innan du utför multipel imputering för saknade data:

  • det första VILLKORET för multipel imputering för saknade data är att data ska saknas slumpmässigt. Med andra ord anger det första VILLKORET för multipel imputering för saknade data att sannolikheten för de saknade data på en viss variabel kan bero på andra observerade variabler, men kan inte bero på sig själv.
  • det andra villkoret för multipel imputering för saknade data är att modellen som används av forskaren för att beräkna värdena ska vara lämplig.
  • det tredje villkoret för multipel imputering för saknade data är att modellen som används av forskaren ska matcha den andra modellen som används för multipel imputering för saknade data.

problemet är dock att det är ganska lätt för forskaren att bryta mot sådana förhållanden när han utför flera imputeringar för saknade data. Detta beror på att det finns fall av multipel imputering för saknade data där data inte saknas slumpmässigt.

för att lösa detta problem uppskattar forskaren modellen för de data som inte saknas slumpmässigt. Men sådana modeller är komplexa och otestbara, och de kräver därför en del välutrustad programvara för att utföra.

en annan sak som forskaren bör komma ihåg är att om ’missing at random’ är nöjd, är de objektiva uppskattningarna som erhållits genom multipel imputering för saknade data inte alltid lätta att tolka.

relaterade sidor:

  • saknade värden i Data

Lämna ett svar

Din e-postadress kommer inte publiceras.