Rozwiązanie: Drzewa klasyfikacyjne
Należy wykorzystać DRZEWA KLASYFIKACYJNE. W rozdziale tym znajdziemy narzędzia przeznaczone do przewidywania przynależności przypadków lub obiektów do klas wyznaczonych przez zmienną zależną o charakterze nominalnym na podstawie pomiarów jednej lub wielu zmiennych niezależnych (objaśniających).
Analiza określana terminem Drzewo klasyfikacyjne jest jedną z głównych technik wykorzystywanych w trakcie tzw. Zgłębiania danych (Data Mining). Moduł Drzewa klasyfikacyjne stanowi obszerną implementację technik przeznaczonych do obliczania drzew klasyfikacyjnych o charakterze binarnym w oparciu o podziały jednowymiarowe dla zmiennych niezależnych (objaśniających) wyrażonych na skali nominalnej, zmiennych niezależnych porządkowych (mierzonych przynajmniej na skali porządkowej) lub obydwu rodzajów zmiennych jednocześnie. Zawiera on również opcje służące do obliczania drzew klasyfikacyjnych w oparciu o liniowe kombinacje podziałów dla zmiennych niezależnych (objaśniających) wyrażonych na skali interwałowej.
Celem drzew klasyfikacyjnych jest przewidywanie lub wyjaśnianie odpowiedzi (reakcji) otrzymywanych w przypadku zmiennej zależnej nominalnej i w pewnym sensie techniki drzew klasyfikacyjnych są podobne do technik stosowanych w przypadku bardziej tradycyjnych metod, takich jak Analiza dyskryminacyjna, Analiza skupień, Statystyki nieparametryczne oraz Regresja nieliniowa. Elastyczność metody drzew klasyfikacyjnych sprawia, że stanowi ona niezwykle atrakcyjną opcję analizy ale nie oznacza to, że jest bardziej zalecana niż metody bardziej tradycyjne. W praktyce, jeśli zostaną napotkane przekonywujące założenia teoretyczne, wówczas metody bardziej tradycyjne mogą być bardziej zalecane. Ale w charakterze techniki eksploracyjnej lub jako metoda stosowana w ostateczności w sytuacji gdy tradycyjne techniki zawodzą, w opinii wielu badaczy drzew klasyfikacyjnych okazują się niedoścignionym narzędziem.
