Test czy eksploracja
dr inż. Adam Walanus
StatSoft Polska

Czy nasza cywilizacja stabilizuje się, czy raczej zmierza w kierunku ciągłych, coraz szybszych zmian wszystkiego i w każdym aspekcie? To ważne pytanie dla statystyka, który bada tę że cywilizację, albo jakieś jej części, i chce wiedzieć, czy stosować testy, czy raczej metody eksploracyjne. Wygląda na to, że jest coraz szybciej (Pani korektorko! może mogłoby zostać "jest coraz szybciej"?). Zmiany wszystkiego są coraz szybsze. Ewoluujący na przestrzeni milionów lat gatunek homo sapiens nie ma szans nadążyć. Dzisiejszy przedszkolak, bawiący się windowsową myszą, jest bez szans na przyszłość. Po czterdziestce, gdy już będą zapomniane technologie bioprocesorów, nie będzie rozumiał nic z tego (tamtego; 2040) świata. W lepszej systuacji jest już ma dzisiejszy czterdziestolatek kształcony na fortranowych odrach, karmionych dziurkowanymi kartonikami, coś tam jeszcze łapie z dzisiejszych technologii informatycznych. Dawniej (jak to brzmi!) było inaczej, ojciec uczył syna tego, czego nauczył go dziadek. Bezwzględna odległość czasowa wnuka od dziadka nie zmienia się. Średni czas trwania pokolenia jest mniej więcej stały, a jeżeli nie, to raczej się wydłuża. Równocześnie średni czas między rewolucyjnymi ewolucjami w technologii skraca się. I to skraca się coraz szybciej. Szybkość jest coraz szybsza. Czy to ma sens? Tak, to po prostu zależność wykładnicza, czyli eksponencjalna (nie expotencjalna!) czyli funkcja ex, rośnie ona lawinowo, rośnie rosnąco. Straszne.


Rys. 1. Funkcja wykładnicza; rośnie coraz szybciej, a szybkość jej przyrostów jest coraz większa, szybkość szybkości też, itd

Procesy technologiczne, procesy społeczne, wskaźniki ekonomiczne, cokolwiek daje się mierzyć wykazuje pewną zmienność, mamy wahania, oscylacje, jakieś tendencje, trendy. Ta zmienność, w jakimś sensie, może być stabilna, może być przewidywalna. Jest zmienność, ale taka, która nas nie zaskakuje. Jest więc stabilnie, jako-tako stabilnie. Ale tylko do czasu, do raczej bliskiego czasu, dopóki ktoś w naszym otoczeniu nie przejdzie na nową technologię albo nasz dostawca to zrobi, albo stanie się coś o czym nie będziemy wiedzieć, co jednak będzie miało wpływ na nas i naszą działalność (gospodarczą, naukową, administracyjną i każdą inną).

Do testowania stabilności niestabilności służą metody statystyczne. A metody statystyka ma różne, na przykład testy statystyczne. Podobnie jak testy w życiu codziennym, w kuchni i w ogródku, test statystyczny też ma jednobitowy wynik: jest OK albo nie jest OK. Wąchamy wczorajszą wędlinkę i kierujemy ją na stół albo pod stół, do kosza. Nie ma trzeciej drogi, chyba że mamy psa, który nam się opatrzył. Zwróćmy przy okazji uwagę na to, że przy testowaniu możemy popełnić dwa rodzaje błędów. Możemy wyrzucić dobrą szynkę (jest to błąd pierwszego rodzaju) albo zjeść zepsutą (błąd drugiego rodzaju). Kalkulacja ekonomiczna kosztu tych błędów jest bardzo ważna przy projektowaniu testu, aczkolwiek może ona nie być łatwa do przeprowadzenia. W programie STATISTICA jest nawet specjalny moduł służący do analizy mocy testów, wspomagający decyzję na temat ostrości kryterium świeżości szynki, albo rozstrzygania innych kwestii (np. czy opracowana przez nas terapia jest bardziej skuteczna niż stosowane do tej pory).

Dlaczego STATISTICA podaje wynik testu za pomocą koloru (czerwony lub czarny) a nie pisze wyraźnie: TAK/NIE; są podstawy do odrzucenia hipotezy o przydatności szynki do spożycia, czy ich nie ma? Czerwone cyfry oczywiście sygnalizują niezgodność z oczekiwaniami. Poza jednym bitem koloru, użytkownikowi niejako wpychana jest tu jeszcze dodatkowa informacja: pokolorowana liczba p, która jest prawdopodo-bieństwem, a w "czerwonym" przypadku właściwie nieprawdo-podo-bieństwem tego, że szynka jednak jest dobra?


Rys. 2. Wynik testu statystycznego: czerwone/czarne = niedobrze/dobrze, ale dodatkowo liczba mówiąca w jakim stopniu dane są zgodne z założoną hipotezą

Dodatkowa, może i zbędna informacja jest objawem tendencji eksploracyjnej, przeważającej nad jednobitową metodą testową. STATISTICA sugeruje: rozejrzyj się. Wynik testu masz analityku taki a taki, ale popatrz szerzej, czy może nie jest ten wynik zbyt, albo za mało oczywisty. Nie wpadaj w rutynę, świat, który analizujesz, jest bogatszy niż myślisz, może Cię zaskoczyć. Otoczenie jest raczej bardziej niestabilne, a niepewność naszej oceny rzeczy większa raczej niż mniejsza. Trzeba się rozglądać, czy aby nie stało się coś, czego nie przewidywaliśmy. Jeżeli granicą pomiędzy czerwonym i czarnym jest typowe w takich wypadkach prawdopodobieństwo równe 0.05, to 0.049 będzie czerwone, a 0.051 czarne. Ale czarne 0.051 jest na granicy czerni, powinno wzbudzić nieufność do swojej czerni. Z drugiej strony, jeżeli czerwona liczba wynosi 0.003, to jest bardzo odległa od granicznego 0.05, jest bardzo czerwona. Ta szynka jest zielona.

Patrząc ilościowo, analogowo, a nie tylko zero-jedynkowo, idziemy w kierunku eksploracji, w kierunku rozglądania się, kombinowania, jednym słowem postępujemy nieschematycznie. Nie wystarcza nam prosta odpowiedź TAK/NIE. Nie powinna nam wystarczać, właśnie ze względu na niestabilność świata, niestabilność nieprzewidywalną. Nastawienie eksploracyjne jest dziś konieczne. Schematem staje się przełamywanie schematów. Nawet dobrze ustawiony test powinien być kontrolowany, testowany, bo minął już pewien czas od jego ustawienia. Jak eksplorować? Używając różnych narzędzi, właśnie różnych, a nie jednego, standardowego. Ogólnie wskazać to można na grafikę: najwydajniejszy interfejs maszyna-człowiek.


Rys. 3. Jeden bit, więcej bitów, jeszcze więcej bitów, grafika

Wykres zwykle nie zawiera całej informacji zawartej w danych liczbowych, które ilustruje, właśnie, zaledwie ilustruje. Grubość linii i punktów jest za duża dla bardzo dokładnych liczb, jakimi być może dysponujemy. Inną sprawą, o której się nie myśli, jest znaczenie tych cyfr, tzw. "po przecinku", matematycznie mniej znaczących, a realnie często w ogóle nie znaczących, a na dodatek zaciemniających obraz, odwracających uwagę od istotnych rzeczy zawartych w danych. Nie bójmy się straty informacji na rysunku. Spodziewajmy się raczej wydobycia ważnych relacji siedzących w danych, w ich wnętrzu (jak coś zawiera trochę więcej informacji, to zawsze ma jakieś wnętrze).

Z drugiej strony rysunek, zawiera dużo zbędnej, redundantnej informacji, jak na przykład proste linie łączące dwa punkty. Po co są te linie, czym w ogóle jest wykres, rysunek, obrazek? Graficzna prezentacja danych jest próbą dostosowania się do struktur mózgu rozpoznających genetycznie predefiniowane wzorce. Interfejs transmitujący informację od maszyny do człowieka nie jest prosty ze względu na nieokreśloność języka odbiorcy. Nie rozkodowano jeszcze mózgu, nie odczytano ludzkiego genomu. Kierując przekaz do wizualnej percepcji człowieka, poruszamy się po omacku, intuicyjnie. Chcemy tworzyć wykresy ładne, a nie tylko czytelne. Jest to uzasadnione, bo w każde, nawet najprostsze działanie człowieka są zaangażowane emocje. Trzeba trafić do tych emocji.

Twórcą przekazu musi być człowiek, inny mózg, nie maszyna, ta powinna dostarczyć jedynie narzędzia. Narzędzia elastycznego, nie ograniczającego inwencji twórczej, a z drugiej strony nie angażującego intelektu w nieciekawe sprawy przetwarzania danych i organizacji wykresu.

STATISTICA daje użytkownikowi bogate narzędzie do wizualizacji zarówno danych surowych jak i wyników analiz. Obfitość jest dwuwymiarowa; po pierwsze jest dużo typów wykresów, po drugie jest możliwość dostosowania do własnych potrzeb prawie wszystkich elementów wykresów. Ponadto, wszystko to robi się łatwo. Pamiętajmy, że statystyka jest nie tylko dla specjalistów, dziś trafia ona pod strzechy, chociażby za sprawą systemów jakości ISO 9000, które wymagają stosowania metod statystycznych.

Eksploracja to w dużej mierze oglądanie różnorodnych wykresów. Test to jeden bit, jedna kropka. Może to niedobrze, że świat się komplikuje tak, że musimy patrzeć na rysunki i nie wystarcza nam jeden bit, ale tak jest. STATISTICA jest na to przygotowana, nawet z pewnym wyprzedzeniem.


Rys. 4. Czasami dokładność danych jest taka, że lepiej byłoby je wykreślać ołówkiem na serwetce. W STATISTICA Basic można to zasymulować.


Rys. 5. Przykład wykresu STATISTICA. Wykres blokowy pięciu zmiennych, kierunek patrzenia i inne elementy grafiki dobrane są tendencyjnie. Przekaz emocjonalny wziął tu zdecydowanie górę nad czytelnością wykresu.


Rys. 6. Inny przykład wykresu STATISTICA. Może tego nie widać, ale jest to zapis ruchu trzech planet. Stosunkowo prosty algorytm, który być może będzie tu jeszcze omówiony, pozwala na świetną zabawę w gwiezdne wojny

Powrót na początek

Poprzedni artykuł