Možnosti použití metod mnohonásobné imputace v prostředí systému SAS

15. januára 2025

1/2025 vedecké články

Roman Pavelka, Štatistický úrad Slovenskej republiky, Slovenská republika

Typ článku: vedecký článok
Strany: 41 – 65

Abstrakt

Chybějící hodnoty představují u většiny statistických analýz komplikace. Pozorování s nevyplněnými hodnotami proměnných (nazývané také jako neúplné případy) jsou ze statistických analýz zjištěných pozorování ve většině statistických softwarů implicitně vyřazovány. Použití úplných případů (pozorování s kompletně vyplněnými hodnotami u všech proměnných) je sice jednoduché, ale zpravidla vykoupené ztrátou informace v důsledku vyloučení neúplných případů. Navíc vyloučení neúplných pozorování ze statistických analýz také ignoruje potenciální systematické rozdíly mezi odhady a skutečnými hodnotami a výsledná statistická inference nemusí být použitelná na sledovanou populaci všech statistických jednotek (všech případů), zejména v podmínkách menšího počtů kompletních případů. Z tohoto důvodu je proto důležité analyzovat nejen data pozorovaná, ale i rozpoznat mechanismus chybění (statistický model resp. rozdělení pravděpodobnosti) neúplných dat s cílem jejich vhodného doplnění přijatelnými (imputovanými) hodnotami. Ačkoli existuje mnoho různých metod pro práci s nekompletními daty, jednou z nejvíce významných metod řešení otázek neúplnosti zjištěných dat se stala metoda mnohonásobné imputace. I v prostředí analytického systému SAS použití metody mnohonásobné imputace představuje jednu z možností řešení neúplných dat, a právě toto bude náplní předkládaného článku.

Článok na stiahnutie
PDF (1,9 MB, 364 stiahnutí)

Počet videní: 157

analytický systém SAS, autor Roman PAVELKA, inference, mechanismus chybění, mnohonásobná imputace

Možnosti použití metod mnohonásobné imputace v prostředí systému SAS

Abstrakt

ŠTATISTICKÝ ÚRAD SR

INFORMAČNÝ SERVIS