Multiple imputation for manglende data er en attraktiv metode for håndtering av manglende data i multivariat analyse. Ideen om multiple imputation for manglende data ble først foreslått Av Rubin (1977).
Prosedyre
følgende er prosedyren for å gjennomføre multiple imputation for manglende data som Ble opprettet Av Rubin i 1987:
- det første trinnet med multiple imputation for manglende data er å imputere de manglende verdiene ved å bruke en passende modell som inkorporerer tilfeldig variasjon.
- det andre trinnet med flere imputasjoner for manglende data er å gjenta det første trinnet 3-5 ganger.
- det tredje trinnet med multiple imputation for manglende data er å utføre den ønskede analysen på hvert datasett ved å bruke standard, komplette datametoder.
- det fjerde trinnet med multiple imputation for manglende data er å gjennomsnittlig verdiene til parameterestimatene over de manglende verdiprøvene for å oppnå et enkeltpunktestimat.
- det femte trinnet med multiple imputation for manglende data er å beregne standardfeilene ved å gjennomsnittlig de kvadrerte standardfeilene for de manglende verdiestimatene. Etter dette må forskeren beregne variansen av den manglende verdiparameteren over prøvene. Til slutt må forskeren kombinere de to mengdene i flere imputasjoner for manglende data for å beregne standardfeilene.
Funksjoner
Flere imputasjon for manglende data har flere ønskelige funksjoner:
- Multiple imputation for manglende data gjør det mulig for forskeren å oppnå omtrent objektive estimater av alle parametrene fra den tilfeldige feilen. Forskeren kan ikke oppnå dette resultatet fra deterministisk imputering, som multiple imputering for manglende data kan gjøre.
- denne multiple imputasjonen for manglende data gjør at forskeren kan få gode estimater av standardfeilene. Multiple imputation for manglende data er ulikt enkelt imputation, siden det ikke tillater ytterligere feil å bli introdusert av forskeren.
- forskeren kan utføre flere imputering for manglende data med noen form for data i noen form for analyse, uten velutstyrt programvare.
det er imidlertid visse forhold som bør oppfylles før du utfører flere imputasjoner for manglende data.
Betingelser
Betingelser som bør oppfylles før du utfører multiple imputation for manglende data:
- den første betingelsen for multiple imputation for manglende data er at dataene skal mangle tilfeldig. Med andre ord, den første betingelsen for multiple imputation for manglende data sier at sannsynligheten for manglende data på en bestemt variabel kan avhenge av andre observerte variabler, men kan ikke avhenge av seg selv.
- den andre betingelsen for multiple imputation for manglende data er at modellen som brukes av forskeren til å imputere verdiene, skal være hensiktsmessig.
- den tredje betingelsen for multiple imputation for manglende data er at modellen som brukes av forskeren, skal samsvare med den andre modellen som brukes for multiple imputation for manglende data.problemet er imidlertid at det er ganske enkelt for forskeren å bryte slike forhold mens han utfører flere imputasjoner for manglende data. Dette skyldes at det er tilfeller av flere imputasjoner for manglende data der dataene ikke mangler tilfeldig.
for å løse dette problemet estimerer forskeren modellen for dataene som ikke mangler tilfeldig. Men slike modeller er komplekse og untestable, og de krever derfor litt velutstyrt programvare for å utføre.En annen ting forskeren bør huske på er at hvis ‘mangler tilfeldig’ er fornøyd, er de objektive estimatene som oppnås ved flere imputasjoner for manglende data ikke alltid lett å tolke.
Relaterte Sider:
- Manglende Verdier i Data