wielokrotne przypisanie brakujących danych jest atrakcyjną metodą obsługi brakujących danych w analizie wielowymiarowej. Idea wielokrotnego przypisywania brakujących danych została po raz pierwszy zaproponowana przez Rubina (1977).
procedura
poniżej przedstawiono procedurę przeprowadzania wielokrotnego przypisania brakujących danych, która została stworzona przez Rubina w 1987 roku:
- pierwszym krokiem wielokrotnego przypisania brakujących danych jest przypisanie brakujących wartości za pomocą odpowiedniego modelu, który zawiera zmienność losową.
- drugim krokiem wielokrotnego przypisania brakujących danych jest powtórzenie pierwszego kroku 3-5 razy.
- trzecim etapem wielokrotnego przypisywania brakujących danych jest przeprowadzenie pożądanej analizy każdego zbioru danych przy użyciu standardowych, pełnych metod danych.
- czwartym etapem wielokrotnego przypisania brakujących danych jest uśrednianie wartości estymacji parametru w próbkach brakujących wartości w celu uzyskania estymacji pojedynczego punktu.
- piątym etapem wielokrotnego przypisywania brakujących danych jest obliczenie błędów standardowych poprzez uśrednianie do kwadratu błędów standardowych oszacowań wartości brakujących. Następnie badacz musi obliczyć wariancję brakującego parametru wartości w próbkach. Wreszcie, badacz musi połączyć dwie ilości w wielu imputacji dla brakujących danych do obliczenia błędów standardowych.
cechy
wielokrotne przypisanie brakujących danych ma kilka pożądanych cech:
- wielokrotne przypisanie brakujących danych umożliwia naukowcowi uzyskanie w przybliżeniu bezstronnych szacunków wszystkich parametrów z błędu losowego. Badacz nie może osiągnąć tego wyniku z imputacji deterministycznej, co może zrobić wielokrotna imputacja brakujących danych.
- to wielokrotne przypisanie brakujących danych pozwala badaczowi uzyskać dobre szacunki błędów standardowych. Wielokrotne przypisanie brakujących danych różni się od przypisania pojedynczego, ponieważ nie pozwala na wprowadzenie dodatkowego błędu przez badacza.
- badacz może wykonać wielokrotne przypisanie brakujących danych za pomocą dowolnego rodzaju danych w dowolnej analizie, bez dobrze wyposażonego oprogramowania.
jednak istnieją pewne warunki, które powinny być spełnione przed wykonaniem wielokrotnego przypisania brakujących danych.
Warunki
warunki, które powinny być spełnione przed wykonaniem wielokrotnego przypisania brakujących danych:
- pierwszym warunkiem wielokrotnego przypisania brakujących danych jest losowy brak danych. Innymi słowy, pierwszy warunek wielokrotnego przypisania brakujących danych stanowi, że prawdopodobieństwo brakujących danych na konkretnej zmiennej może zależeć od innych obserwowanych zmiennych, ale nie może zależeć od siebie.
- drugim warunkiem wielokrotnego przypisania brakujących danych jest to, że model używany przez badacza do przypisania wartości powinien być odpowiedni.
- trzecim warunkiem wielokrotnego przypisania brakujących danych jest to, że model używany przez badacza powinien pasować do innego modelu używanego do wielokrotnego przypisania brakujących danych.
problem polega jednak na tym, że dość łatwo jest badaczowi naruszyć takie warunki podczas wykonywania wielokrotnego przypisywania brakujących danych. Dzieje się tak dlatego, że istnieją przypadki wielokrotnego przypisania brakujących danych, w których dane nie brakuje losowo.
aby rozwiązać ten problem, badacz szacuje model dla danych, których nie brakuje losowo. Ale takie modele są złożone i nie do przetestowania, a zatem wymagają dobrze wyposażonego oprogramowania do działania.
kolejną rzeczą, o której powinien pamiętać badacz, jest to, że jeśli „brakujące losowo” jest spełnione, to bezstronne szacunki uzyskane przez wielokrotne przypisanie brakujących danych nie zawsze są łatwe do zinterpretowania.
powiązane strony:
- brakujące wartości w danych