Temat: Jaką metodę statystyczną wybrać?
Trochę małe te próby, ale to klasyczny problem medycyny...
Trudno "na odległość", nie widząc danych, udzielić prostej odpowiedzi. Jest dużo możliwości, które mogą się zdarzyć. Trzeba znać naturę testów dla różnic w zależności od rozkładów, z jakich pochodzą porównywane próby*.
Przede wszystkim trzeba zobaczyć dane na histogramie. Dodatkowo trzeba poczytać, czy nauka wie coś na temat rozkładu badanej cechy. Może z szerzej zakrojonych badań o liczniejszych próbach wiadomo, że rozkład nie różni się zbytnio od rozkładu normalnego?
Test normalności przy tej liczbie zapewne nie odrzuci H0 o pochodzeniu próby z r.norm. o ile odchylenia nie są zbyt wielkie. Nic w tym dziwnego, praktycznie żaden test nie ma odpowiedniej mocy przy tej liczebności próby.
* Jeśli odrzuci, jeśli nauka nic nie mówi na temat rozkładu tej cechy, a w danych nie ma punktów odstających, to wtedy test nieparametryczny, tylko ważne, co badający - kształty dystrybuant (K-S) czy przesunięcia (MWW) czy parametr skali (A-B). To wyniknie z analizy histogramu.
Na początku można spróbować porównać parametr skali (A-B). Jeśli nie różnią się stat. istotnie to użyć testu MWW. Jeśli tak - K-S.
* Jeśli odrzuci, w danych nie ma pkt. odst. ale nauka twierdzi, że rozkład zmierza do r. normalnego - można spróbować użyć parametrycznego testu t. W końcu założenie tego testu dotyczy populacji, nie próby. Pojawi się jednak problem przy skośnych rozkładach. Wtedy trzeba porównać wyniki z permutacyjnym/bootstrapowym testem t.
Tyle, że trudno będzie uzasadnić takie podejście, recenzent może odrzucić taką argumentację, bo "skoro rozkład nie jest normalny, to test nieparametryczny". Oczywiście można z tym polemizować.
* Jeśli odrzuci, a w danych są punkty odstające - być może należą one do jakiejś specyficznej grupy i warto je chwilowo wykluczyć, a potem sprawdzić, co z rozkładem.
* Jeśli nie odrzuci - to i tak niewiele wiemy (mała próba -> niska moc testów), ale możemy spróbować użyć testu t - najlepiej klasycznego i permutacyjnego/bootstrapowego.
Osobiście zawsze porównuję wyniki testów param. i nieparam., bo widząc kształty rozkładu i wiedząc, co badają poszególne testy (jaki rodzaj różnic) mogę wyciągnąć więcej wniosków.
---------------
Podsumowując: jeśli nie ma możliwości konsultacji ze statystykiem, sprawdzić normalność rozkładu. Jak H0 odrzucona - test nieparametryczny (MWW). Jak nie odrzucona - parametryczny (t). Jeśli jest możliwość konsultacji - to powyżej pokazałem przykładową ścieżkę wnioskowania.
----------------------
* Dla pewnych kombinacji rozkładów i wielkości różnic (efektu) większą moc ma test MWW, dla innych - test t, a nawet prosty test median. Podobnie jest z inną "furtką" - Centralnym Tw. Granicznym - ono też zapewnia zbieżność rozkładu średnich do r.norm. w różnym tempie zależnie od kształtu rozkładu danych. Planuję na ten temat artykuł za jakiś czas.
Adrian Olszewski edytował(a) ten post dnia 16.04.13 o godzinie 11:41