Czy nasza cywilizacja stabilizuje się, czy raczej zmierza w kierunku ciągłych, coraz szybszych zmian wszystkiego i w każdym aspekcie? To ważne pytanie dla statystyka, który bada tę że cywilizację, albo jakieś jej części, i chce wiedzieć, czy stosować testy, czy raczej metody eksploracyjne. Wygląda na to, że jest coraz szybciej (Pani korektorko! może mogłoby zostać "jest coraz szybciej"?). Zmiany wszystkiego są coraz szybsze. Ewoluujący na przestrzeni milionów lat gatunek homo sapiens nie ma szans nadążyć. Dzisiejszy przedszkolak, bawiący się windowsową myszą, jest bez szans na przyszłość. Po czterdziestce, gdy już będą zapomniane technologie bioprocesorów, nie będzie rozumiał nic z tego (tamtego; 2040) świata. W lepszej systuacji jest już ma dzisiejszy czterdziestolatek kształcony na fortranowych odrach, karmionych dziurkowanymi kartonikami, coś tam jeszcze łapie z dzisiejszych technologii informatycznych. Dawniej (jak to brzmi!) było inaczej, ojciec uczył syna tego, czego nauczył go dziadek. Bezwzględna odległość czasowa wnuka od dziadka nie zmienia się. Średni czas trwania pokolenia jest mniej więcej stały, a jeżeli nie, to raczej się wydłuża. Równocześnie średni czas między rewolucyjnymi ewolucjami w technologii skraca się. I to skraca się coraz szybciej. Szybkość jest coraz szybsza. Czy to ma sens? Tak, to po prostu zależność wykładnicza, czyli eksponencjalna (nie expotencjalna!) czyli funkcja ex, rośnie ona lawinowo, rośnie rosnąco. Straszne.
Rys. 1. Funkcja wykładnicza; rośnie coraz szybciej, a szybkość jej przyrostów jest coraz większa, szybkość szybkości też, itd
Do testowania stabilności niestabilności służą metody statystyczne. A metody statystyka ma różne, na przykład testy statystyczne. Podobnie jak testy w życiu codziennym, w kuchni i w ogródku, test statystyczny też ma jednobitowy wynik: jest OK albo nie jest OK. Wąchamy wczorajszą wędlinkę i kierujemy ją na stół albo pod stół, do kosza. Nie ma trzeciej drogi, chyba że mamy psa, który nam się opatrzył. Zwróćmy przy okazji uwagę na to, że przy testowaniu możemy popełnić dwa rodzaje błędów. Możemy wyrzucić dobrą szynkę (jest to błąd pierwszego rodzaju) albo zjeść zepsutą (błąd drugiego rodzaju). Kalkulacja ekonomiczna kosztu tych błędów jest bardzo ważna przy projektowaniu testu, aczkolwiek może ona nie być łatwa do przeprowadzenia. W programie STATISTICA jest nawet specjalny moduł służący do analizy mocy testów, wspomagający decyzję na temat ostrości kryterium świeżości szynki, albo rozstrzygania innych kwestii (np. czy opracowana przez nas terapia jest bardziej skuteczna niż stosowane do tej pory).
Dlaczego STATISTICA podaje wynik testu za pomocą koloru (czerwony lub czarny) a nie pisze wyraźnie: TAK/NIE; są podstawy do odrzucenia hipotezy o przydatności szynki do spożycia, czy ich nie ma? Czerwone cyfry oczywiście sygnalizują niezgodność z oczekiwaniami. Poza jednym bitem koloru, użytkownikowi niejako wpychana jest tu jeszcze dodatkowa informacja: pokolorowana liczba p, która jest prawdopodo-bieństwem, a w "czerwonym" przypadku właściwie nieprawdo-podo-bieństwem tego, że szynka jednak jest dobra?
Rys. 2. Wynik testu statystycznego: czerwone/czarne = niedobrze/dobrze, ale dodatkowo liczba mówiąca w jakim stopniu dane są zgodne z założoną hipotezą
Patrząc ilościowo, analogowo, a nie tylko zero-jedynkowo, idziemy w kierunku eksploracji, w kierunku rozglądania się, kombinowania, jednym słowem postępujemy nieschematycznie. Nie wystarcza nam prosta odpowiedź TAK/NIE. Nie powinna nam wystarczać, właśnie ze względu na niestabilność świata, niestabilność nieprzewidywalną. Nastawienie eksploracyjne jest dziś konieczne. Schematem staje się przełamywanie schematów. Nawet dobrze ustawiony test powinien być kontrolowany, testowany, bo minął już pewien czas od jego ustawienia. Jak eksplorować? Używając różnych narzędzi, właśnie różnych, a nie jednego, standardowego. Ogólnie wskazać to można na grafikę: najwydajniejszy interfejs maszyna-człowiek.
Rys. 3. Jeden bit, więcej bitów, jeszcze więcej bitów, grafika
Z drugiej strony rysunek, zawiera dużo zbędnej, redundantnej informacji, jak na przykład proste linie łączące dwa punkty. Po co są te linie, czym w ogóle jest wykres, rysunek, obrazek? Graficzna prezentacja danych jest próbą dostosowania się do struktur mózgu rozpoznających genetycznie predefiniowane wzorce. Interfejs transmitujący informację od maszyny do człowieka nie jest prosty ze względu na nieokreśloność języka odbiorcy. Nie rozkodowano jeszcze mózgu, nie odczytano ludzkiego genomu. Kierując przekaz do wizualnej percepcji człowieka, poruszamy się po omacku, intuicyjnie. Chcemy tworzyć wykresy ładne, a nie tylko czytelne. Jest to uzasadnione, bo w każde, nawet najprostsze działanie człowieka są zaangażowane emocje. Trzeba trafić do tych emocji.
Twórcą przekazu musi być człowiek, inny mózg, nie maszyna, ta powinna dostarczyć jedynie narzędzia. Narzędzia elastycznego, nie ograniczającego inwencji twórczej, a z drugiej strony nie angażującego intelektu w nieciekawe sprawy przetwarzania danych i organizacji wykresu.
STATISTICA daje użytkownikowi bogate narzędzie do wizualizacji zarówno danych surowych jak i wyników analiz. Obfitość jest dwuwymiarowa; po pierwsze jest dużo typów wykresów, po drugie jest możliwość dostosowania do własnych potrzeb prawie wszystkich elementów wykresów. Ponadto, wszystko to robi się łatwo. Pamiętajmy, że statystyka jest nie tylko dla specjalistów, dziś trafia ona pod strzechy, chociażby za sprawą systemów jakości ISO 9000, które wymagają stosowania metod statystycznych.
Eksploracja to w dużej mierze oglądanie różnorodnych wykresów. Test to jeden bit, jedna kropka. Może to niedobrze, że świat się komplikuje tak, że musimy patrzeć na rysunki i nie wystarcza nam jeden bit, ale tak jest. STATISTICA jest na to przygotowana, nawet z pewnym wyprzedzeniem.
Rys. 4. Czasami dokładność danych jest taka, że lepiej byłoby je wykreślać ołówkiem na serwetce. W STATISTICA Basic można to zasymulować.
Rys. 5. Przykład wykresu STATISTICA. Wykres blokowy pięciu zmiennych, kierunek patrzenia i inne elementy grafiki dobrane są tendencyjnie. Przekaz emocjonalny wziął tu zdecydowanie górę nad czytelnością wykresu.
Rys. 6. Inny przykład wykresu STATISTICA. Może tego nie widać, ale jest to zapis ruchu trzech planet. Stosunkowo prosty algorytm, który być może będzie tu jeszcze omówiony, pozwala na świetną zabawę w gwiezdne wojny
| Powrót na początek | ||
| Poprzedni artykuł | ||