A hiányzó adatok többszörös beszámítása

a hiányzó adatok többszörös beszámítása vonzó módszer a hiányzó adatok kezelésére többváltozós elemzésben. A hiányzó adatok többszörös beszámításának gondolatát először Rubin (1977) javasolta.

eljárás

a következő eljárás a Rubin által 1987-ben létrehozott hiányzó adatok többszörös beszámításának végrehajtására:

  • a hiányzó adatok többszörös beszámításának első lépése a hiányzó értékek beszámítása egy megfelelő modell használatával, amely magában foglalja a véletlenszerű variációt.
  • a hiányzó adatok többszörös beszámításának második lépése az első lépés 3-5 alkalommal történő megismétlése.
  • a hiányzó adatok többszörös beszámításának harmadik lépése a kívánt elemzés elvégzése minden adatkészleten standard, teljes adatmódszerekkel.
  • a hiányzó adatok többszörös beszámításának negyedik lépése a paraméterbecslések értékeinek átlagolása a hiányzó értékminták között annak érdekében, hogy egyetlen pontbecslést kapjunk.
  • a hiányzó adatok többszörös beszámításának ötödik lépése a standard hibák kiszámítása a hiányzó értékbecslések négyzet alakú standard hibáinak átlagolásával. Ezt követően a kutatónak ki kell számítania a hiányzó értékparaméter varianciáját a minták között. Végül a kutatónak össze kell kapcsolnia a két mennyiséget a hiányzó adatok többszörös imputálásában a standard hibák kiszámításához.

jellemzők

a hiányzó adatok többszörös beszámítása számos kívánatos tulajdonsággal rendelkezik:

  • a hiányzó adatok többszörös beszámítása lehetővé teszi a kutató számára, hogy megközelítőleg elfogulatlan becsléseket szerezzen az összes paraméterről a véletlenszerű hibából. A kutató ezt az eredményt nem érheti el determinisztikus imputációval, amelyet a hiányzó adatok többszörös imputálása megtehet.
  • a hiányzó adatok többszörös beszámítása lehetővé teszi a kutató számára, hogy jó becsléseket szerezzen a standard hibákról. A hiányzó adatok többszörös imputálása ellentétben áll az egyszeri imputációval, mivel nem teszi lehetővé a kutató további hibáinak bevezetését.
  • a kutató több adatot is elvégezhet a hiányzó adatok bármilyen elemzésben, jól felszerelt szoftver nélkül.

vannak azonban bizonyos feltételek, amelyeknek teljesülniük kell a hiányzó adatok többszörös beszámításának végrehajtása előtt.

feltételek

feltételek, amelyeknek teljesülniük kell a hiányzó adatok többszörös beszámításának végrehajtása előtt:

  • a hiányzó adatok többszörös beszámításának első feltétele, hogy az adatok véletlenszerűen hiányozzanak. Más szavakkal, a hiányzó adatok többszörös beszámításának első feltétele kimondja, hogy a hiányzó adatok valószínűsége egy adott változón függhet más megfigyelt változóktól, de nem függhet önmagától.
  • a hiányzó adatok többszörös beszámításának második feltétele, hogy a kutató által az értékek beszámítására használt modellnek megfelelőnek kell lennie.
  • a hiányzó adatok többszörös beszámításának harmadik feltétele az, hogy a kutató által használt modellnek meg kell egyeznie a másik modellel, amelyet a hiányzó adatok többszörös beszámításához használnak.

a probléma azonban az, hogy a kutató számára meglehetősen könnyű megsérteni az ilyen feltételeket, miközben a hiányzó adatok többszörös beszámítását végzi. Ennek oka az, hogy vannak olyan esetek, amikor a hiányzó adatok többszörös beszámításra kerülnek, ahol az adatok véletlenszerűen nem hiányoznak.

a probléma megoldása érdekében a kutató becsüli a véletlenszerűen hiányzó adatok modelljét. De az ilyen modellek összetettek és tesztelhetetlenek, ezért jól felszerelt szoftvereket igényelnek.

egy másik dolog, amit a kutatónak szem előtt kell tartania, az, hogy ha a ‘véletlenszerűen hiányzik’ teljesül, akkor a hiányzó adatok többszörös beszámításával kapott elfogulatlan becsléseket nem mindig könnyű értelmezni.

kapcsolódó oldalak:

  • hiányzó értékek az adatokban

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.