Rozwiązanie: Poszukiwanie skupień lub naturalnych grup
Należy zastosować ANALIZĘ SKUPIEŃ. Rozdział ten zawiera procedury do wykrywania skupień hierarchicznych (struktur drzewiastych) opartych na różnych miarach podobieństwa i regułach grupowania takich jak grupowanie metodą k-średnich lub łączenie parami. Podobne procedury znajdują się w rozdziale DRZEWA KLASYFIKACYJNE.
W przypadku analizy hierarchicznej łączenie obiektów w skupienia odbywa się krokami dając w rezultacie drzewo połączeń łączące wszystkie obiekty. Termin "obiekt" znaczy tu przypadek (obserwacja) lub zmienna. Obydwa rodzaje analizy skupień mogą być równoprawnie przeprowadzane. Otrzymane drzewo może odsłonić klarowne gałęzie połączeń obiektów które są bardziej do siebie podobne niż do obiektów w innych gałęziach. Można w ten sposób odkryć istniejącą strukturę obiektów w zbiorze danych.
W przypadku grupowania metodą k-średnich deklaruje się a priori oczekiwaną liczbę skupień (grup). Program będzie próbował znaleźć najlepszy podział wszystkich obiektów na k grup. Dostępne są różne statystyki pozwalające na wspomaganie decyzji czy znaleziono najlepszy układ skupień, to znaczy czy rzeczywiście obiekty wewnątrz skupienia są naprawdę bardziej podobne do siebie niż do tych obiektów, które znalazły się w innych skupieniach.
W przypadku łączenia podwójnego dokonuje się konstrukcji skupień równocześnie dla zmiennych i przypadków. W szczególności program stara się formować skupienia podobnych punktów pomiarowych (wartości).
