puuttuvien arvojen käsite on tärkeä ymmärtää, jotta tietoja voidaan hallita onnistuneesti. Jos tutkija ei käsittele puuttuvia arvoja oikein, hän voi päätyä tekemään aineistosta virheellisen päätelmän. Epäasianmukaisen käsittelyn vuoksi tutkijan saama tulos eroaa niistä, joissa puuttuvat arvot ovat.
eräkohtainen vastauskato syntyy, kun vastaaja ei vastaa tiettyihin kysymyksiin stressin, väsymyksen tai tiedon puutteen vuoksi. Vastaaja ei välttämättä vastaa, koska osa kysymyksistä on arkaluonteisia. Näitä vastausten puuttumista pidettäisiin puuttuvina arvoina.
puuttuvien arvojen käsittely
tutkija voi jättää Aineiston tai tehdä aineiston imputoinnin niiden tilalle. Oletetaan, että puuttuvien arvojen määrä on erittäin pieni; sitten asiantuntija tutkija voi pudottaa tai jättää nämä arvot pois analyysistä. Jos tapauksia on tilastokielessä alle 5% otoksesta, tutkija voi pudottaa ne.
monimuuttuja-analyysissä, jos puuttuvia arvoja on suurempi määrä, voi olla parempi pudottaa nämä tapaukset (kuin tehdä imputointi) ja korvata ne. Toisaalta univariaattisessa analyysissä imputaatio voi vähentää harhan määrää aineistossa, jos arvot puuttuvat sattumanvaraisesti.
on olemassa kaksi satunnaisesti puuttuvaa muotoa:
- MCAR: puuttuu kokonaan satunnaisesti
- MAR: puuttuu satunnaisesti
ensimmäinen muoto puuttuu kokonaan satunnaisesti (MCAR). Tämä muoto on olemassa, kun puuttuvat arvot jaetaan sattumanvaraisesti kaikkien havaintojen kesken. Tämä lomake voidaan vahvistaa jakamalla tiedot kahteen osaan: yksi sarja sisältää puuttuvat arvot ja toinen sisältää ei-puuttuvat arvot. Kun aineisto on jaettu osiin, suoritetaan suosituin testi, jota kutsutaan keskimääräisen eron t-testiksi, jotta voidaan tarkistaa, onko otoksessa eroja kahden tietojoukon välillä.
tutkijan kannattaa pitää mielessä, että jos aineisto on MCAR, hän voi valita puuttuvien arvotapausten pari-tai listaviisaan poiston. Jos tiedot eivät kuitenkaan ole MCAR, suoritetaan imputointi niiden korvaamiseksi.
toinen muoto puuttuu sattumanvaraisesti (MAR). MAR: ssa puuttuvat arvot eivät jakaudu satunnaisesti havaintojen kesken, vaan ne jaetaan yhden tai useamman osanäytteen sisällä. Tämä muoto on yleisempi kuin edellinen.
ongelmallisin muoto on puuttuva arvo, johon kuuluvat sellaiset puuttuvien arvojen tyypit, jotka eivät ole satunnaisesti jakautuneet havaintojen kesken. Tällöin todennäköisyyttä ei voida ennustaa mallin muuttujista. Tämä voidaan sivuuttaa suorittamalla data imputointi korvata ne.
SPSS: ssä on estimointimenetelmiä, jotka antavat tutkijalle tiettyjä tilastollisia menetelmiä puuttuvien arvojen estimoimiseksi. Nämä ovat nimittäin regressio, suurin todennäköisyys estimointi, lista-viisas tai pari-viisas poisto, likimääräinen Bayesilainen bootstrap, useita tietoja imputointi, ja monet muut.