Roman Pavelka, Štatistický úrad Slovenskej republiky, Slovenská republika
Typ článku: vedecký článok
Strany: 41 – 65
Abstrakt
Chybějící hodnoty představují u většiny statistických analýz komplikace. Pozorování s nevyplněnými hodnotami proměnných (nazývané také jako neúplné případy) jsou ze statistických analýz zjištěných pozorování ve většině statistických softwarů implicitně vyřazovány. Použití úplných případů (pozorování s kompletně vyplněnými hodnotami u všech proměnných) je sice jednoduché, ale zpravidla vykoupené ztrátou informace v důsledku vyloučení neúplných případů. Navíc vyloučení neúplných pozorování ze statistických analýz také ignoruje potenciální systematické rozdíly mezi odhady a skutečnými hodnotami a výsledná statistická inference nemusí být použitelná na sledovanou populaci všech statistických jednotek (všech případů), zejména v podmínkách menšího počtů kompletních případů. Z tohoto důvodu je proto důležité analyzovat nejen data pozorovaná, ale i rozpoznat mechanismus chybění (statistický model resp. rozdělení pravděpodobnosti) neúplných dat s cílem jejich vhodného doplnění přijatelnými (imputovanými) hodnotami. Ačkoli existuje mnoho různých metod pro práci s nekompletními daty, jednou z nejvíce významných metod řešení otázek neúplnosti zjištěných dat se stala metoda mnohonásobné imputace. I v prostředí analytického systému SAS použití metody mnohonásobné imputace představuje jednu z možností řešení neúplných dat, a právě toto bude náplní předkládaného článku.
Článok na stiahnutie
PDF (1,9 MB, 3 stiahnutí)