Způsoby výběru vysvětlujících proměnných v klasifikačních stromech

Hana Řezanková, Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze, Česká republika

Strany: 40 – 53

Abstrakt

Článek se zaměřuje na různá hodnocení vztahů mezi kategoriálními proměnnými a jejich aplikaci na problematiku výběru vysvětlujících proměnných v klasifikačních stromech. Jsou jednak diskutovány postupy dostupné v komerčních programových systémech (chí-kvadrát testy a porovnávání variability vysvětlované proměnné v různých skupinách objektů pomocí Giniho míry a entropie), jednak naznačeny další možnosti vývoje v této oblasti. Stávající postupy jsou ilustrovány na analýze dat v programovém systému IBM SPSS Decision Trees. Výzkum se v poslední době zaměřuje na hodnocení jednostranné závislosti ordinální vysvětlované proměnné na proměnné nominální a implementaci v rámci klasifikačních stromů. Takové přístupy již byly realizovány v balíčcích v prostředí R.

Článok na stiahnutie
PDF (1,4 MB, 350 stiahnutí)