Przewidywanie zagrożenia hipomagnezemią u chorych po zabiegu chirurgicznym
prof. dr hab. Andrzej Sokołowski
Akademia Ekonomiczna w Krakowie

Spis treści:

Sformułowanie problemu
Identyfikacja zmiennych różnicujących grupy
Analiza dyskryminacyjna
Założenia analizy dyskryminacyjnej
Wykorzystanie analizy dyskryminacyjnej do klasyfikacji


Sformułowanie problemu

Właścicielem prezentowanych danych statystycznych jest lek. med. Barbary Machowska z Centrum Onkologii, Oddział w Krakowie.

Pomimo, że magnez jest drugim pod względem ilościowym kationem wewnątrzkomórkowym, jego rola w ustroju długo była niedoceniana. Obecnie wiadomo, że pełni on rolę kofaktora w ponad trzystu reakcjach chemicznych, związanych z przenoszeniem energii przez nukleotydy, rozkładem węglowodanów, syntezą białek i tłuszczów, transportem błonowym sodu, potasu i wapnia, prawidłowym przewodzeniem nerwowym, pobudzeniem i skurczem mięśni szkieletowych, regulacją napięcia i kurczliwości mięśni gładkich oraz sprawnym działaniem mięśnia sercowego.

Nadal jednak zwraca się uwagę, że hipomagnezemia jest najczęstszym nierozpoznanym zaburzeniem elektrolitowym, występującym na oddziałach intensywnej opieki medycznej. Przyczyną tego jest fakt, że magnez nadal nie należy do rutynowo badanych elektrolitów, a hipomagnezemia, z jednej strony do pewnego poziomu może przebiegać bezobjawowo, a z drugiej - towarzyszące jej zwykle inne zaburzenia elektrolitowe mogą maskować objawy niedoboru samego magnezu.

Coraz częściej opisywane jest zjawisko hipomagnezemii we wczesnym okresie pooperacyjnym. Klinicznymi konsekwencjami tego stanu są: wzrost częstości zaburzeń rytmu serca, niewydolność wieńcowa, zaburzenia neurologiczne, a nawet zwiększona śmiertelność.

Na podstawie nielicznych doniesień można przypuszczać, że chorzy na nowotwory złośliwe są bardziej narażeni na spadek poziomu magnezu w surowicy. W literaturze nie ma prac na temat zmian stężenia magnezu w surowicy, u chorych operowanych z powodu nowotworów złośliwych. Postanowiono zbadać jak zmienia się stężenie magnezu w surowicy po operacji, u chorych operowanych z powodu raka żołądka oraz jelita grubego. Cele pracy to:

1. Zbadanie zachowania się stężenia magnezu w surowicy w okresie okołooperacyjnym u chorych na nowotwory złośliwe żołądka oraz jelita grubego.

2. Ocena czy pooperacyjna podaż magnezu wpływa korzystnie na przebieg pooperacyjny

3. Określenie przedoperacyjnych cech klinicznych i biochemicznych, które wskażą chorych zagrożonych hipomagnezemią po operacji

Badano stężenie magnezu w surowicy, u chorych operowanych w Klinice Chirurgii Onkologicznej COOK, z powodu nowotworów złośliwych żołądka oraz jelita grubego przed operacją i przez cztery kolejne dni po operacji. Badanie obejmowało chorych operowanych w latach 1996-1998. Wstępnie rozważano 42 chorych. W przebiegu pooperacyjnym, u 52% chorych stwierdzono hipomagnezemię. W związku z tym wyróżniono dwie grupy chorych:

1. 20 chorych u których w dobie operacji i przez pierwsze cztery dni po operacji, poziom magnezu utrzymywał się w granicach normy

2. 22 chorych, u których, co najmniej w jednej dobie w czasie prowadzonego badania, poziom magnezu w surowicy obniżył się poniżej normy

Badania poszerzono o dodatkowych 25 chorych, u których w dobie operacji i przez cztery kolejne dni po operacji, podawano dożylnie magnez w ilości 2,5 ml 20% MgSO4, tj. 2 mmole Mg2+ na każde 500 ml przetoczonych płynów.

Podstawowym zadaniem jest znalezienie metody statystycznej, która pozwoli na przewidywanie zagrożenia hipomagnezemią na podstawie informacji dostepnych przed zabiegiem chirurgicznym.

Powrót do spisu treści


Identyfikacja zmiennych różnicujących grupy

Do identyfikacji cech różnicujących grupę z hipomagnezemią od grupy bez niej wykorzystamy test dla dwóch wartości przeciętnych w przypadku porównywania cech mierzalnych oraz test niezależności chi-kwadrat w przypadku cech jakościowych.

Test dla dwóch wartości przeciętnych wykorzystujący statystykę t Studenta wymaga spełnienia założenia normalności rozkładu badanej cechy, oraz w niektórych swych wersjach również założenia o równości wariancji. Test dla dwóch wartości przeciętnych jest dostępny w module Podstawowe statystyki i tabele jako Test t dla prób niezależnych. Zastosowano go do następujących zmiennych: wiek (zmienna numer 5), wzrost (6), waga (7), procent wagi należnej (8), powierzchnia ciała (9), czas objawów (15), wielkość guza (16), poziomy sodu (18), potasu (19), chloru (20), wapnia (21), mocznika (22), kreatyniny (23), białka całkowitego (24), albumin (25), alfa 1 (26), alfa 2 (27), beta (28), gamma (29), magnezu (30), fosforu (31), pH (32), pCO2 (33), pO2 (34), HCO3, Be (36), hematokrytu (37), hemoglobiny (38) i leukocytów (39).


Rysunek 1

Powyżej przedstawiono wybór odpowiednich opcji w oknie Testy dla prób niezależnych. Po naciśnięciu klawisza Testy t otrzymujemy tabelę z wynikami, której ze względu na rozmiary tu nie przytaczamy. Stwierdzamy, że zmienne, które różnicują porównywane grupy to: waga, powierzchnia ciała, poziom sodu, magnezu oraz fosforu. Zmienną która ma największą zdolność diagnostyczną jest poziom magnezu przed operacją. Interesującą forma ilustracji tej relacji jest wykres ramkowy


Rysunek 2

Założenie normalności rozkładu sprawdzimy przy pomocy testu Shapiro-Wilka. W module Podstawowe statystyki i tabele dostępny jest on w części poświęconej liczeniu statystyk podstawowych lub w części do tabulacji pojedynczych zmiennych. W tej drugiej opcji uzyskujemy następujące wyniki:


Rysunek 3

Ze wzglądu na istotne odstępstwo od rozkładu normalnego w przypadku trzech zmiennych, wyniki identyfikacji zmiennych diagnostycznych zweryfikujemy dodatkowo przy pomocy nieparametrycznego testu Manna-Whitney'a. Znajdujemy go w module Statystyki nieparametryczne / Rozkłady.

W trakcie analizy uaktywniamy opcje pozwalającą poddać analizie podzbiór danych z aktywnego pliku.


Rysunek 4

Wprowadzone warunki selekcji przewidują, że korzystamy z danych zapisanych w tzw. dobie zerowej, czyli w dniu operacji. W zmiennej v1 doba zerowa ma kod 100. W analizie porównujemy grupy:
"Hipomagnezemia" i "Normomagnezemia" - stąd warunek na zmienną v2. Wyniki testu Manna-Whitneya wskazują, że wszystkie zmienne diagnostyczne wyłonione przy zastosowaniu testu Studenta wykazują swe właściwości poprzez odrzucenie hipotezy zerowej (o równości wartości przeciętnych) również w teście nieparametrycznym.

Ewentualny wpływ zmiennych jakościowych na występowanie hipomagnezemii sprawdzamy przy pomocy testu niezależności chi-kwadrat. W module Podstawowe statystyki i tabele korzystamy z Tabeli wielodzielczych. Na przykład wynik testowania badania wpływu płci na różnicowanie badanych grup podsumowany jest w następujących dwóch oknach wyników.


Rysunek 5


Rysunek 6


Prawdopodobieństwo testowe zarówno w teście chi-kwadrat jak i w dokładnym teście Fishera jest duże i nie pozwala na odrzucenie hipotezy o niezależności. Nie można więc twierdzić, że u którejś płci hipomagnezemia występuje istotnie częściej. W naszej próbie w grupie z hipomagnezemią jest 59% mężczyzn, a w grupie bez niej - 65%, ale tę różnicę należy uznać za przypadkową. Podobny wynik świadczący o braku zdolności prognostycznych występowania hipomagnezemii uzyskano w odniesieniu do takich cech jakościowych jak występowanie nadciśnienia, choroba wieńcowa, cukrzyca, palenie papierosów i stopień zaawansowania nowotworu.

Powrót do spisu treści


Analiza dyskryminacyjna

Analiza funkcji dyskryminacyjnej jest stosowana do rozstrzygania, które zmienne dyskryminują dwie lub więcej naturalnie wyłaniające się grupy. Na przykład, w badaniach oświatowych można badać, które zmienne dyskryminują absolwentów szkół średnich, którzy decydują się (1) iść na studia, (2) uczęszczać do pomaturalnych szkół zawodowych lub (3) zaprzestać dalszej nauki. W tym celu badacz mógł zebrać dane dotyczące wielu zmiennych poprzedzających ukończenie szkoły. Po ukończeniu szkoły większość absolwentów naturalnie wpadnie do jednej z trzech wymienionych kategorii. Analiza dyskryminacyjna mogłaby następnie być wykorzystana do rozstrzygnięcia, która zmienna lub zmienne są najlepszymi predyktorami późniejszego wyboru absolwentów.

W badaniach medycznych można rejestrować różne zmienne związane z przeszłością pacjentów, aby sprawdzić, które zmienne najlepiej prorokują, czy pacjent ma szansę na zupełne wyleczenie (grupa 1), częściowe wyleczenie (grupa 2), czy nie ma szans (grupa 3). Biolog mógłby rejestrować różne charakterystyki podobnych typów (grup) kwiatów, a następnie wykonać analizę funkcji dyskryminacyjnej w celu określenia zestawu charakterystyk, które umożliwiają najlepszą dyskryminację tych typów.

Z rachunkowego punktu widzenia, analiza funkcji dyskryminacyjnej jest bardzo podobna do analizy wariancji (ANOVA). Rozważmy prosty przykład. Wyobraźmy sobie, że mierzymy wzrost w losowej próbie 50 mężczyzn i 50 kobiet. Kobiety nie są, przeciętnie, tak wysokie jak mężczyźni, a różnica ta znajdzie odbicie w różnicy średnich (dla zmiennej Wzrost). Dlatego zmienna wzrost pozwala nam zróżnicować mężczyzn i kobiety z większym niż przypadkowe prawdopodobieństwem: jeśli osoba jest wysoka, to prawdopodobnie jest mężczyzną, jeśli osoba jest niska, to prawdopodobnie jest kobietą.

Możemy uogólnić to rozumowanie na mniej trywialne grupy i zmienne. Na przykład, wyobraźmy sobie, że mamy dwie grupy absolwentów szkoły średniej: tych, którzy zdecydowali się iść na studia po szkole i tych, którzy się nie zdecydowali. Mogliśmy byli zmierzyć deklarowane zamierzenia studentów dotyczące studiów na rok przed ukończeniem szkoły. Jeśli średnie w tych dwóch grupach (wśród tych, którzy faktycznie poszli na studia i tych, którzy nie poszli) byłyby różne, to moglibyśmy stwierdzić, że zamiar pójścia na studia zadeklarowany na rok przed ukończeniem szkoły umożliwia nam odróżnienie tych, którzy są i tych, którzy nie są kandydatami na studia (a informacja taka może być wykorzystana przez konsultantów zawodowych, którzy służyliby doradztwem odpowiednim uczniom).

Podsumowując, główna idea leżąca u podstaw analizy funkcji dyskryminacyjnej to rozstrzyganie, czy grupy różnią się ze względu na średnią pewnej zmiennej, a następnie wykorzystanie tej zmiennej do przewidywania przynależności do grupy (np. nowych przypadków).

Przedstawione zagadnienie funkcji dyskryminacyjnej może być przeformułowane na problem jednoczynnikowej analizy wariancji (ANOVA). W szczególności, można zapytać, czy dwie lub więcej grupy różnią się istotnie od siebie ze względu na średnią pewnej zmiennej. Powinno być jednak jasne, że jeśli średnie pewnej zmiennej są istotnie różne w różnych grupach, to możemy powiedzieć, że ta zmienna dyskryminuje te grupy.

W przypadku pojedynczej zmiennej, ostatecznym testem istotności tego, czy zmienna dyskryminuje grupy, jest test F. Statystyka F jest obliczana jako stosunek wariancji międzygrupowej do wariancji wewnątrzgrupowej. Jeśli wariancja międzygrupowa jest istotnie większa to muszą występować istotne różnice między średnimi.

Zazwyczaj w badaniach zajmujemy się kilkoma zmiennymi w celu sprawdzenia, która lub które przyczyniają się do dyskryminowania grup. W takim przypadku mamy macierz całkowitych wariancji i kowariancji; ponadto mamy macierz zgrupowanych wewnątrzgrupowych wariancji i kowariancji. Aby rozstrzygnąć, czy są jakieś istotne różnice (odnośnie wszystkich zmiennych) między grupami, możemy porównać te dwie macierze przy pomocy wielowymiarowych testów F. Jest to procedura identyczna jak wielowymiarowa analiza wariancji lub MANOVA. Tak samo jak w wielowymiarowej analizie wariancji, możemy najpierw zastosować test wielowymiarowy , a następnie, jeśli wykazuje on istotność różnic, możemy sprawdzić, które zmienne mają istotnie różne średnie w grupach. Zatem nawet jeśli obliczenia dla wielu zmiennych są bardziej złożone, to rozumowanie pozostaje takie samo, chodzi mianowicie o to, że szukamy zmiennych, które dyskryminują grupy, co znajduje wyraz w obserwowanych różnicach średnich. Możemy zatem wykonać analizę funkcji dyskryminacyjnej przy pomocy modułu ANOVA/MANOVA; jednak w analizie dyskryminacyjnej (o czym mowa dalej) zwyczajowo oblicza się i interpretuje inne rodzaje statystyk.

Powrót do spisu treści


Założenia analizy dyskryminacyjnej

Rozkład normalny. Zakłada się, że dane (ujęte w postaci zmiennych) reprezentują próbę z wielowymiarowego rozkładu normalnego. Zauważmy, że przy pomocy analizy dyskryminacyjnej bardzo łatwo można tworzyć histogramy rozkładów liczebności z poziomu arkuszy wyników (jedno kliknięcie przycisku). Zatem użytkownik może badać, czy zmienne mają rozkład normalny czy nie. Zauważmy jednak, że naruszanie założenia o normalności zazwyczaj nie jest "zgubne" w tym sensie, że wypadkowe testy istotności itd. pozostają odporne. W module ANOVA/MANOVA znajdują się specjalne testy na normalność rozkładu.

Homogeniczność wariancji/kowariancji. Zakłada się, że macierze wariancji/kowariancji zmiennych są homogeniczne w grupach. I znów, nieznaczne odchylenia nie są tak ważne. Zanim jednak przyjmiemy ostateczne wnioski z ważnego badania, warto może przejrzeć macierze wariancji wewnątrzgrupowych i korelacji. W szczególności warto w tym celu wykorzystać macierz wykresów rozrzutu, którą można utworzyć z okna dialogowego Statystyki opisowe. Jeśli mamy wątpliwości, możemy powtórzyć analizy eliminując jedną lub dwie mniej interesujące grupy. Jeśli ogólne wyniki (interpretacje) pozostaną takie same, to prawdopodobnie wszystko jest w porządku. Można także wykorzystać wiele testów i narzędzi z modułu ANOVA/MANOVA w celu zbadania czy założenie to zostało w naszych danych zachowane, czy nie. Jak wspomniano jednak w części ANOVA/MANOVA, wielowymiarowy test M Boxa na homogeniczność wariancji/kowariancji jest szczególnie wrażliwy na odchylenia od wielowymiarowej normalności i nie powinien być traktowany zbyt "poważnie".

Korelacje między średnimi i wariancjami. Podstawowe "rzeczywiste" zagrożenie dla trafności testów istotności pojawia się wówczas, gdy średnie zmiennych w grupach są skorelowane z wariancjami (lub odchyleniami standardowymi). Intuicyjnie, jeśli w grupie występuje duża zmienność przy szczególnie dużych średnich niektórych zmiennych, to te wysokie średnie nie są rzetelne. Ogólne testy istotności są jednak oparte na zgrupowanych wariancjach, to znaczy na przeciętnej wariancji z wszystkich grup. Zatem, testy istotności dla relatywnie większych średnich (przy dużych wariancjach) byłyby oparte na relatywnie mniejszych wariancjach zgrupowanych, odbijając się omyłkowo na istotności statystycznej. W praktyce, model taki może się pojawić wtedy, gdy jedna z badanych grup zawiera kilka przypadków odstających, które mają duży wpływ na średnie a także zwiększają zmienność. Aby ustrzec się przed tym problemem, skontrolujmy statystyki opisowe, to znaczy średnie i odchylenia standardowe lub wariancje na okoliczność takich korelacji. Moduł ANOVA/MANOVA umożliwia także kreślenie średnich i wariancji (lub odchyleń standardowych) na wykresie rozrzutu.

Problem złego uwarunkowania macierzy. Inne założenie analizy funkcji dyskryminacyjnej wymaga, by zmienne wykorzysywane do dyskryminacji grup nie były w pełni redundantne. Częścią obliczeń analizy dyskryminacyjnej jest odwrócenie macierzy wariancji/kowariancji zmiennych w modelu. Jeśli któraś ze zmiennych jest redundantna wobec innych zmiennych, to o macierzy mówi się, że jest źle uwarunkowana i nie może być odwrócona. Na przykład, jeśli zmienna jest sumą trzech innych zmiennych, które także znajdują się w modelu, to macierz jest źle uwarunkowana.

Wartości tolerancji. Aby ustrzec się złego uwarunkowania macierzy STATISTICA będzie stale sprawdzać dla każdej zmiennej tak zwaną wartość tolerancji. Wartość ta jest rutynowo wyświetlana, gdy chcemy przeglądać zestawienie statystyczne dla zmiennych włączonych do modelu i tych spoza modelu. Wartość tolerancji jest obliczana jako 1 minus R-kwadrat danej zmiennej przy włączeniu do bieżącego modelu wszystkich innych zmiennych. Zatem jest to część wariancji wyjaśniana przez daną zmienną. Więcej informacji na temat regresji wielokrotnej i interpretacji wartości tolerancji znajduje się także w części Regresja wielokrotna. Ogólnie, gdy zmienna jest prawie zupełnie redundantna (a zatem może pojawić się problem złego uwarunkowania macierzy), wartość tolerancji dla tej zmiennej zbliży się do 0. Domyślna wartość w analizie dyskryminacyjnej dla minimalnej akceptowalnej tolerancji wynosi 0.01. STATISTICA wyświetli komunikat o złym uwarunkowaniu macierzy, gdy tolerancja dla dowolnej zmiennej wypadnie poniżej tej wartości, to jest jeśli dowolna zmienna będzie redundantna w więcej niż 99% (użytkownik może zmienić tę domyślną wartość).

Powrót do spisu treści


Wykorzystanie analizy dyskryminacyjnej do klasyfikacji

Jednym z głównych celów zastosowania analizy dyskryminacyjnej jest predykcja klasyfikacji przypadków. Jak możemy przewidzieć, do której grupy należy dany przypadek, gdy już zdefiniujemy model i obliczymy funkcje dyskryminacyjne?

Predykcje a priori i post hoc. Zanim przejdziemy do szczegółów różnych procedur estymacji, chcielibyśmy upewnić się, że ta różnica jest jasna. Oczywiście, jeśli estymujemy funkcje dyskryminacyjne, które najlepiej dyskryminują grupy w oparciu o pewien zbiór danych, a następnie wykorzystujemy te same dane do oceny, na ile trafna jest nasza predykcja, to przeważnie zyskujemy tu przez przypadek. Ogólnie, zawsze dostaniemy gorszą klasyfikację wtedy, gdy przewidujemy przynależność przypadków, które nie były użyte do estymacji funkcji dyskryminacyjnej. Innymi słowy, predykcje post hoc są zawsze lepsze niż predykcje a priori. (Trudność z predykcją przyszłości a priori polega na tym, że nie wiemy co się stanie; znacznie łatwiej jest znaleźć sposoby predykcji tego, o czym wiemy, że się zdarzyło). Dlatego nie należy opierać swojego zaufania dotyczącego poprawnej klasyfikacji przyszłych obserwacji na tym samym zbiorze danych, z którego zostały wyprowadzone funkcje dyskryminacyjne; jeśli chcemy klasyfikować przypadki przyszłe to należy raczej zebrać nowe dane, aby "wypróbować" (zbadać trafność) użyteczność funkcji dyskryminacyjnych.

Funkcje klasyfikacyjne. Moduł analizy dyskryminacyjnej automatycznie oblicza funkcje klasyfikacyjne. Nie powinno się ich mylić z funkcjami dyskryminacyjnymi. Funkcje klasyfikacyjne mogą być wykorzystane do rozstrzygania, do której grupy najprawdopodobniej należą poszczególne przypadki. Jest tyle funkcji klasyfikacyjnych ile grup. Każda funkcja pozwala nam obliczyć wartości klasyfikacyjne dla każdego przypadku w każdej grupie. Funkcje klasyfikacyjne mogą być bezpośrednio wykorzystane do obliczenia wartości klasyfikacyjnych dla nowych obserwacji (na przykład, mogą być one określone w formułach arkusza jako formuły do obliczenia nowych zmiennych; gdy do pliku zostaną dodane nowe przypadki, wartości klasyfikacyjne zostaną obliczone automatycznie).

Klasyfikacja przypadków. Gdy obliczyliśmy wartości klasyfikacyjne dla przypadku, łatwo zdecydować, jak sklasyfikować ten przypadek: zwykle klasyfikujemy przypadek jako należący do grupy, dla której ma on największą wartość klasyfikacyjną (jeśli prawdopodobieństwa klasyfikacji a priori nie różnią się poważnie; patrz poniżej). Zatem jeśli mieliśmy badać kariery/wybory naukowe (np. wstąpienie na studia, uczęszczanie do szkół pomaturalnych, podjęcie pracy) absolwentów szkół średnich w oparciu o kilka zmiennych zmierzonych rok przed ukończeniem szkoły, mogliśmy wykorzystać funkcje klasyfikacyjne w celu predykcji, co najprawdopodobniej zrobi każdy uczeń po szkole. Chcielibyśmy jednak poznać także prawdopodobieństwo tego, że dany uczeń zachował się zgodnie z przewidywaniem. Prawdopodobieństwa te nazywa się prawdopodobieństwami a posteriori i można je także obliczyć. Aby zrozumieć, jak wyprowadza się te prawdopodobieństwa, rozważmy najpierw tak zwane odległości Mahalanobisa.

Odległości Mahalanobisa. Ogólnie, odległość Mahalanobisa to miara odległości między dwoma punktami w przestrzeni zdefiniowanej przez dwie lub więcej skorelowanych zmiennych. Na przykład, jeśli mamy dwie zmienne, które są nieskorelowane, to możemy wykreślić punkty (przypadki) na standardowym dwuwymiarowym wykresie rozrzutu; odległości Mahalanobisa między tymi punktami byłyby wówczas identyczne do odległości Euklidesa; byłaby to taka odległość, jaką na przykład odmierza linijka. Jeśli mamy trzy nieskorelowane zmienne, to do określenia odległości między punktami także możemy po prostu użyć linijki (na wykresie 3W). Jeśli mamy więcej niż 3 zmienne, nie możemy ich już przedstawić na wykresie. Ponadto, jeśli zmienne są skorelowane, to osie wykresu mogą być traktowane jako nieortogonalne, to znaczy nie można by ich było umieścić pod kątem prostym względem siebie. W takich przypadkach zwykła odległość Euklidesa nie jest właściwą miarą, natomiast odległość Mahalanobisa należycie odda korelacje.

Odległości Mahalanobisa i klasyfikacja. Dla każdej grupy w naszej próbie możemy określić położenie punktu reprezentującego średnie dla wszystkich zmiennych w przestrzeni wielowymiarowej zdefiniowanej przez zmienne w modelu. Punkty te nazywają się centroidami. Dla każdego przypadku możemy obliczyć odległości Mahalanobisa (danego przypadku) od każdego z centroidów grupowych. A następnie moglibyśmy sklasyfikować przypadek do grupy, której jest najbliższy, to znaczy do tej, do której odległość Mahalanobisa jest najmniejsza.

Prawdopodobieństwa klasyfikacyjne a posteriori. Stosując do klasyfikacji odległości Mahalanobisa, możemy teraz wyprowadzić prawdopodobieństwa. Prawdopodobieństwo, że przypadek wpadnie do danej grupy jest zasadniczo proporcjonalne do odległości Mahalanobisa od centroidu grupy (nie jest dokładnie proporcjonalne ponieważ zakładamy wielowymiarowy rozkład normalny wokół każdego centroidu). Ponieważ położenie każdego przypadku obliczamy na podstawie naszej wcześniejszej wiedzy o wartościach, jakie zmienne należące do modelu przyjmują dla danego przypadku, prawdopodobieństwa te są nazywane prawdopodobieństwami a posteriori. Podsumowując, prawdopodobieństwo a posteriori jest to prawdopodobieństwo, oparte na naszej wiedzy o wartościach innych zmiennych, że dany przypadek należy do konkretnej grupy. Oczywiście w module analizy dyskryminacyjnej prawdopodobieństwa takie dla wszystkich przypadków (lub tylko dla wybranych przypadków w celu zbadania trafności) będą obliczone automatycznie.

Prawdopodobieństwa klasyfikacyjne a priori. Jest jeszcze jeden dodatkowy czynnik, który powinien być wzięty pod uwagę podczas klasyfikacji przypadków. Czasami zawczasu wiemy, że w jednej z grup jest więcej obserwacji niż w jakiejś innej; zatem prawdopodobieństwo a priori, że przypadek należy do tej grupy jest większe. Na przykład, jeśli zawczasu wiemy, że 60% absolwentów naszej szkoły średniej zwykle wstępuje na studia (20% idzie do szkoły pomaturalnej, a pozostałe 20% do pracy), to powinniśmy skorygować nasze przewidywanie odpowiednio: a priori i przy takich samych pozostałych warunkach, jest bardziej prawdopodobne, że uczeń pójdzie na studia, niż że wybierze którąś z pozostałych możliwości. Analiza dyskryminacyjna umożliwia określenie różnych prawdopodobieństw a priori, które zostaną następnie wykorzystanie do skorygowania klasyfikacji przypadków (i obliczenia prawdopodobieństw a posteriori).

W praktyce badacz powinien zadać sobie pytanie, czy nierówna liczba przypadków w różnych grupach w próbie jest odzwierciedleniem rzeczywistego rozkładu w populacji, czy jest to tylko (losowy) efekt procedury losowania. W pierwszym przypadku ustawilibyśmy prawdopodobieństwa a priori tak, aby były proporcjonalne do rozmiarów grup w naszej próbie, w drugim przypadku określilibyśmy prawdopodobieństwa a priori tak, aby były jednakowe dla każdej grupy. Specyfikacja różnych prawdopodobieństw a priori może poważnie wpłynąć na trafność predykcji.

Zazwyczaj w celu rozstrzygnięcia, na ile dobrze bieżące funkcje klasyfikacyjne pozwalają przewidzieć przynależność przypadków do grupy oglądamy macierz klasyfikacji. Macierz klasyfikacji pokazuje liczbę przypadków, które zostały poprawnie zaklasyfikowane (na przekątnej macierzy) oraz tych, które zostały błędnie zaklasyfikowane.

Powtórzmy jeszcze, że przewidywanie post hoc tego, co zdarzyło się w przeszłości nie jest specjalnie trudne. Nie jest niczym niezwykłym otrzymanie bardzo dobrej klasyfikacji, jeśli wykorzystujemy te same przypadki, na których zostały obliczone funkcje klasyfikacyjne. Aby przekonać się, na ile dobrze "działają" bieżące funkcje klasyfikacyjne, należy zaklasyfikować (a priori) inne przypadki, to znaczy przypadki, które nie były wykorzystywane do oszacowania funkcji klasyfikacyjnych. W analizie dyskryminacyjnej łatwo możemy zastosować warunki selekcji, aby włączyć lub wyeliminować z analizy przypadki; zatem macierz klasyfikacji może zostać obliczone zarówno dla "starych" jak i dla "nowych" przypadków. Tylko klasyfikacja nowych przypadków pozwala nam oszacować trafność predykcyjną funkcji klasyfikacyjnych; klasyfikacja tylko starych przypadków dostarcza użytecznego narzędzia do identyfikowania przypadków odstających lub obszarów, gdzie funkcja klasyfikacyjna wydaje się być mniej trafna.

Ogólnie analiza dyskryminacyjna jest bardzo przydatnym narzędziem (1) do wykrywania tych zmiennych, które pozwalają badaczowi dyskryminować różne (naturalne wyłaniające się) grupy oraz (2) do klasyfikacji przypadków do różnych grup z większą niż przypadkowa trafnością.

W naszym problemie wykorzystujemy wcześniej wybrane zmienne: waga, powierzchnia ciała, poziom sodu, magnezu oraz potasu. W odpowiednim oknie definiujemy te zmienne.


Rysunek 7

Najważniejszym wynikiem praktycznym są funkcje klasyfikacyjne, które opisaliśmy w części teoretycznej.


Rysunek 8

Pozwalają one identyfikować chorych o dużym zagrożeniu hipomagnezemią. Zgodnie z tą zasadą nasze przypadki zostały pogrupowane następująco:


Rysunek 9

Prawidłowo zakwalifikowano więc wszystkich (!) chorych u których wystąpiła hipomagnezemia, a wśród chorych bez hipomagnezemii 2 zostało błędnie zakwalifikowanych do grupy narażonych.

Powrót do spisu treści

Poprzedni artykuł