Temat: założenie o homogeniczności wariancji - proszę o pomoc
Anna Kowalska:
czy ktos moze mi objasnic na czym to zalozenie konkretnie polega? tzn. konkretnie na testowaniu podobienstwa ktorych wariancji (wewnatrz- czy miedzygrupowej) bazuje?
dzieki za ew. pomoc
Zakładam, że chodzi Ci o test w rodzaju ANOVA?
Teoria (i niektóre przykłady z życia wzięte) mówi tyle:
Aby porównywać wartości oczekiwane (dla ANOVA, gdzie rozkłady powinny być normalne, estymatorem w.o. są średnie arytmetyczne), musisz mieć podobne rozproszenia wokół średniej w każdej grupie. Innymi słowy, "rozkłady muszą być podobnie szerokie".
A to dlatego, że w teście ANOVA badasz stosunek różnic międzygrupowych do sumarycznej wariancji wewnątrzgrupowej.
Na tę ostatnią "pracuje" każda z grup i każda powinna mieć jednakowy "wkład". Wtedy wiesz, że jeśli są jakieś różnice, to wynikają rzeczywiście z różnic między grupami, a nie dodatkowo z różnic w samych grupach ("w środku, w Czesiu" :) )
Skąd te odchylenia wewnątrzgrupowe? Powodów większego błędu może być wiele: niższa liczebność (ANOVA nie zakłada równolicznych prób), punkty odstające w grupie (tzw. outliers), albo po prostu ta grupa wyraźnie wyróżnia się na tle innych i porównywanie jej z innymi może nie mieć ma większego sensu. Zdarza się także skorelowanie średniej z wariancją.
Podsumowując, odchylenia od średniej mogą powstać przypadkowo (stąd nazwa: SS error), np. poprzez punkty odstające, a także wskutek faktycznych różnic między grupami. To jest ta "właściwa" różnica (stąd nazwa SS effect).
Jeśli błędy wewnątrzgrupowe są równe, to dodając je obliczasz "globalną" wariancję wewnątrzgrupową tak, że każdy błąd wnosi tutaj jednakowy wkład. Gdyby jeden z błędów wewn.grup. wnosił większy wkład, wariancja wewnątrzgrupowa poszłaby w górę, a iloraz obu wariancji (miedzy. do wewn) zmalałby.
A to oznacza, że dla danego poziomu istotności coraz trudniej będzie odrzucić hipotezę zerową o równości średnich! I może się wtedy okazać, że wyższa wariancja jednej z grup "zamaskuje" wyższą średnią innej grupy.
Jeśli badasz na przykład, którym pacjentom (z jakiej grupy rozpoznań) potrzeba podać lek, to grupa z dodatkowymi "zakłocaczami" może zamaskować grupę, która na prawdę tego leku potrzebuje.
Badanie występowania punktów odstających, porównywanie różnych rodzajów średnich (np. uciętej i arytmetycznej), badanie homogeniczności wariancji może pomóc uchronić się przed takimi problemami.
Wygląda nieciekawie, ale na szczęście rzeczywistość jest bardziej różowa. Wykazano, że że statystyka F jest w znacznym stopniu odporna na naruszenia założenia homogeniczności wariancji.
Z jednej strony to fajnie. W razie niedotrzymania tego założenia nie musisz przerzucać się od razu na test nieparametryczny (Kruskala-Wallisa albo Friedmana, zależnie od rodzaju porównań). Pewnie, że fajniej mieć wyniki testu parametrycznego :)
Z drugiej - zaleca się, aby w takiej sytuacji jednak WYKONAĆ analizę nieparametryczną - "dla spokojności". Jeśli ona (a jest słabsza) wykaże różnice (odrzuci H0), a o to właśnie chodziło, to tym lepiej i możesz wrócić do ANOVA (podać jej wyniki).
Niestety, zdarzyło mi się, że K-W nie odrzucił H0, a ANOVA tak. I było to właśnie wtedy, gdy założenie o hom. war. nie było spełnione. Niestety, ponieważ chodziło właśnie o odrzucenie H0, nie mogłem przyjąć jej wyników. Bezpieczniej było założyć, że statystycznie istotnie różnic brak.
No i jeszcze jest kwestia recenzenta Twojej pracy :)
Czy potraktuje doniesienia pana Lindego jako wiążące, czy też nie - i zapyta o analizę homog. war.
Pozdrawiam.
Adrian Olszewski edytował(a) ten post dnia 04.01.09 o godzinie 12:31