Imputarea multiplă pentru datele lipsă

imputarea multiplă pentru datele lipsă este o metodă atractivă pentru manipularea datelor lipsă în analiza multivariată. Ideea imputării multiple pentru datele lipsă a fost propusă pentru prima dată de Rubin (1977).

procedura

următoarea este procedura de efectuare a imputării multiple pentru datele lipsă care a fost creată de Rubin în 1987:

  • primul pas al imputării multiple pentru datele lipsă este de a imputa valorile lipsă utilizând un model adecvat care încorporează variații aleatorii.
  • al doilea pas al imputării multiple pentru datele lipsă este repetarea primului pas de 3-5 ori.al treilea pas al imputării multiple pentru datele lipsă este de a efectua analiza dorită pe fiecare set de date utilizând metode standard de date complete.
  • al patrulea pas al imputării multiple pentru datele lipsă este media valorilor estimărilor parametrilor pe eșantioanele de valori lipsă pentru a obține o estimare cu un singur punct.
  • al cincilea pas al imputării multiple pentru datele lipsă este de a calcula erorile standard prin medierea erorilor standard pătrate ale estimărilor valorii lipsă. După aceasta, cercetătorul trebuie să calculeze varianța parametrului de valoare lipsă pe eșantioane. În cele din urmă, cercetătorul trebuie să combine cele două cantități în imputare multiplă pentru datele lipsă pentru a calcula erorile standard.

caracteristici

imputarea multiplă pentru datele lipsă are mai multe caracteristici dorite:

  • imputarea multiplă pentru datele lipsă face posibil ca cercetătorul să obțină estimări aproximativ imparțiale ale tuturor parametrilor din eroarea aleatorie. Cercetătorul nu poate obține acest rezultat din imputarea deterministă, pe care o poate face imputarea multiplă pentru datele lipsă.
  • această imputare multiplă pentru datele lipsă permite cercetătorului să obțină estimări bune ale erorilor standard. Imputarea multiplă pentru datele lipsă este diferită de imputarea unică, deoarece nu permite introducerea unei erori suplimentare de către cercetător.
  • cercetătorul poate efectua mai multe imputări pentru datele lipsă cu orice fel de date în orice fel de analiză, fără software bine echipat.

cu toate acestea, există anumite condiții care ar trebui îndeplinite înainte de a efectua mai multe imputări pentru datele lipsă.

condiții

condiții care trebuie îndeplinite înainte de a efectua imputarea multiplă pentru datele lipsă:

  • prima condiție pentru imputarea multiplă pentru datele lipsă este ca datele să lipsească la întâmplare. Cu alte cuvinte, prima condiție pentru imputarea multiplă pentru datele lipsă afirmă că probabilitatea datelor lipsă pe o anumită variabilă poate depinde de alte variabile observate, dar nu poate depinde de ea însăși.
  • a doua condiție pentru imputarea multiplă pentru datele lipsă este ca modelul utilizat de cercetător pentru a imputa valorile să fie adecvat.
  • a treia condiție pentru imputarea multiplă pentru datele lipsă este ca modelul utilizat de cercetător să se potrivească cu celălalt model care este utilizat pentru imputarea multiplă pentru datele lipsă.

cu toate acestea, problema este că este destul de ușor pentru cercetător să încalce astfel de condiții în timp ce efectuează mai multe imputări pentru datele lipsă. Acest lucru se datorează faptului că există cazuri de imputare multiplă pentru datele lipsă în care datele nu lipsesc la întâmplare.

pentru a rezolva această problemă, cercetătorul estimează modelul pentru datele care nu lipsesc la întâmplare. Dar astfel de modele sunt complexe și netestabile și, prin urmare, necesită un software bine echipat pentru a efectua.

un alt lucru pe care cercetătorul ar trebui să-l țină cont este că, dacă ‘lipsește la întâmplare’ este satisfăcut, atunci estimările imparțiale obținute prin imputarea multiplă a datelor lipsă nu sunt întotdeauna ușor de interpretat.

pagini înrudite:

  • valori lipsă în date

Lasă un răspuns

Adresa ta de email nu va fi publicată.