Statistická analýza chybějících dat

Roman Pavelka, Štatistický úrad Slovenskej republiky, Slovenská republika

Strany: 3 – 26

Abstrakt

Standardní statistické metody byly vyvinuty pro analýzu souborů dat v maticovém uspořádání. Řádky datové matice tradičně reprezentují jednotky, označované také jako případy, pozorování nebo předměty – v závislosti na kontextu. Měřené, resp. zjišťované proměnné nebo také charakteristiky pro každou sledovanou jednotku představují sloupce matice dat. Údaje v datech matice jsou téměř vždy reálná čísla u spojitých proměnných, jako je věk anebo příjem, tržby, nebo představují kategoriální odpovědi, které mohou být uspořádané (např. velikostní kategorie, úroveň vzdělání) nebo neuspořádané (nominální), jako je například odvětví ekonomické činnosti, pohlaví, rasa apod. V praxi výběrových zjišťování se však často objevují datové matice pozorovaných hodnot, ve kterých hodnoty některých charakteristik nejsou zaznamenány a jsou chybějící. Například chybějící hodnoty tržeb, obratu anebo jiných ekonomických ukazatelů v podnikových zjišťováních nebo odmítnutí poskytnutí hodnoty příjmu u respondentů v šetření domácností. Příspěvek se zabývá statistickou analýzou takových datových matic, ve kterých hodnoty jedné nebo více proměnných nejsou kompletně vyplněny.

Článok na stiahnutie
PDF (2,7 MB, 23 stiahnutí)