Kamila Maj

Kamila Maj Student, UMK

Temat: Jak sprawdzić korelację

Witam mam mały problem, na świczeniach zadali nam do sprawdzenia pytanie i hipotezę:

P1.1. Czy istnieje związek między wynikami testów wiedzy a obecnością na wykładach?
H1.1. Istnieje związek między wynikami testów a obecnością na wykładach.

Zmienna zależna: wiedza studentów
Wskaźniki: wyniki testu umiejętności

Zmienna niezależna: średnia obceność na wykładach
Wskaźniki: lista obecności

Prowadzący proponuje podział na 3 grupy: niska obecność, średnia i wysoka - czyli zmienna o charakterze nominalnym, zaś zmienna zależna ma charakter ilościowy. Jakiej korelacji powinnam użyć aby to sprawdzić?
czy muszę sprawdzić jakieś warunki? np. rozkład normalny .

Czytam książkę Rubachy "Statystyka dla pedagogów" ale nic w niej nie ma na ten temat.
Proszę o podpowiedź.

Temat: Jak sprawdzić korelację

Podałaś niewiele informacji, ale tak na szybko:

1. Korelacja Spearmana/Kendalla - odpowie na pytanie czy wzrost jednej zmiennej pociąga za sobą (anty)wzrost drugiej zmiennej. Skoro piszesz o korelacji, to zapewne interesuje Cię szczególnie ta opcja.

2. Analiza wariancji: odpowie na pytanie, czy poziom obecności różnicuje poziom wiedzy + badanie trendu liniowego (w oparciu o kontrasty): odpowie na pytanie o charakter różnicowania. Bądź analiza regresji ze zmiennymi wskaźnikowymi

Co do sprawdzania normalności rozkładu: w przypadku opcji 1) - nie musisz, jest to metoda nieparametryczna. Jeśli chcesz wnioskować dla opcji 2), to sprawdź. Wbrew pozorom jest to długa i złożona historia, ale nie będziemy zaciemniać sprawy.

Niestety nie znam SPSS, więc tu nie pomogę, ale na pewno znajdziesz łatwo informacje jak to policzyć.

PS1: co to jest H1.1? Nie znam takiego zapisu. Hipoteza zerowa brzmi: "nie istnieje związek między wynikami testów a obecnością na wykładach".

PS2: jeśli "niska, średnia, wysoka", to porządkowa (ordinal) nie nominalna (nominal). Nominalna to np. "czerwony", "zielony", 'żółty', tj. bez relacji (cześciowego) porządku.

PS3: nie ma tu zastosowania korelacja wieloseryjna (polyserial).Ten post został edytowany przez Autora dnia 14.01.14 o godzinie 01:26
Kamila Maj

Kamila Maj Student, UMK

Temat: Jak sprawdzić korelację

Dzięki za tak szybką odpowiedź. Teraz chodziaż wiem w którym kierunku szukać. Możesz polecić mi jakąś dobrą książkę w której przyst ępnie opisane są powyższe korelacje? Jestem humanistką więc skomplikowane prace z samymi wzorami i specjalistycznym słownictwem nie przemawia do mnie. Fajna byłby jakaś z przykładami.
Wojciech R.

Wojciech R. Doktor nauk
ekonomicznych/analit
yk/statystyk/dydakty
k

Temat: Jak sprawdzić korelację

Mam nadzieję, Adrian, że mi wybaczysz "wcięcie" się :)

Osobiście polecam dwie:
1. "Przewodnik po statystyce dla socjologów" Marii Nawojczyk,
2. "Pierwsze kroki w analizie danych" Jarosława Górniaka i Janusza Wachnickiego.

Obie są przystępne i, co ważne, pełne przykładów z wykorzystania opisywanych metod w SPSS.
Kamila Maj

Kamila Maj Student, UMK

Temat: Jak sprawdzić korelację

A czy korelacja Chi kwadrat będzie odpowiednia?? Znalazłam w innym wątku odesłanie do strony http://www.goldenline.pl/ramka/aHR0cDovL3d3dy5hdHMudWN...
Wojciech R.

Wojciech R. Doktor nauk
ekonomicznych/analit
yk/statystyk/dydakty
k

Temat: Jak sprawdzić korelację

Test niezależności chi-kwadrat również można przeprowadzić pod warunkiem zgrupowania zmiennej ilościowej. Jednak oznacza to oczywiście utratę informacji (zamiana na słabszą skalę). Dodatkowo szacowane na podstawie statystyki testowej chi-kwadrat miary kontyngencji są również słabsze od proponowanych przez Adriana mierników - pokazują wyłącznie siłę zależności, bez jej kierunku.
Kamila Maj

Kamila Maj Student, UMK

Temat: Jak sprawdzić korelację

Czyli najlepsza będzie korelacja Tau Kendalla lub Rho Spearmana ?
a nie ma tu problemu, że zmienne mają różny rozkład tzn, ilościowy i nominalny.

Temat: Jak sprawdzić korelację

Kamila M.:
Czyli najlepsza będzie korelacja Tau Kendalla lub Rho Spearmana ?

Spearman będzie OK.
a nie ma tu problemu, że zmienne mają różny rozkład tzn, ilościowy i nominalny.

To są skale, a nie rozkłady. I nie nominalna, tylko tak, jak pisałem wcześniej - porządkowa. Lepiej nie mylić tych pojęć przed zaliczeniem/egzaminem.

Co do pytania - metody nieparametryczne* powstały właśnie po to, by radzić sobie w takich sytuacjach.

----------
* metody rangowe niekoniecznie są nieparametryczne, np. test Manna-Whitneya-Wilcoxona, który wymaga założenia o równości parametrów skali obu prób.

PS: przy okazji - co prawda nie zwykłem polecać studentom tego rodzaju literatury....., ale dla osoby, która raczej niekoniecznie chce się zagłębiać w matematykę, a jedynie chce ogarnąć podstawy, przydatna może okazać się książka z serii "Rusz głową - Statystyka". To taki "amerykański eksperyment edukacyjny", oparty o analizę przykładowych problemów (case studies) przewodnik tłumaczący bardzo obrazowo różne statystyczne pojęcia. Niestety, jest dość droga i w żadnym razie nie jest to podręcznik akademicki. Niemniej jednak bardzo początkującej osobie może nieco rozjaśnić i uporządkować wiedzę. Przydała mi się swego czasu jako pomoc dydaktyczna :)Ten post został edytowany przez Autora dnia 14.01.14 o godzinie 18:21
Kamila Maj

Kamila Maj Student, UMK

Temat: Jak sprawdzić korelację

dla korelacji rho Spearmana otrzymałam wyniki :

Obecność na wykładach liczba_punktów_test_końcowy
Współczynnik korelacji 1,000 ,254(**)
Istotność (dwustronna) . ,000
N 220 220

Współczynnik korelacji ,254(**) 1,000
Istotność (dwustronna) ,000 .
N 220 220

korzystając z Siły związków korelacyjnych :
poniżej 0,2 - korelacja słaba (praktycznie brak związku)
0,2 – 0,4 - korelacja niska (zależność wyraźna)
0,4 – 0,6 - korelacja umiarkowana (zależność istotna)
0,6 – 0,8 - korelacja wysoka (zależność znaczna)
0,8 – 0,9 - korelacja bardzo wysoka (zależność bardzo duża)
0,9 – 1,0 - zależność praktycznie pełna

mogę wnioskować, że korelacja jest niska (zależność wyraźna) ? Czy Istotność (dwustronna) na poziomie ,000 informuje mnie że hipoteza jest potwierdzona?

Temat: Jak sprawdzić korelację

Te tabelki to krążą w wielu wersjach :] Ale ogólnie tak :)

Wartość prawdopodobieństwa p na poziomie niższym od założonego poziomu istotności (alfa) świadczy o ODRZUCENIU hipotezy zerowej, czyli tutaj powiemy, że:

"Na poziomie istotności alfa = ??? (0.05? 0.1?, test dwustronny) korelacja między ..... a .... równa 0.25 okazała się istotna statystycznie, co pozwoliło odrzucić hipotezę o braku wpływu .... na ..... Oznacza to występowanie statystycznie istotnej zależności między .... a ....". I dalej dyskusja siły zależności i interpretacja.

PS: 000 - ech kocham ten zapis... On oznacza pvalue < 0.001.Ten post został edytowany przez Autora dnia 14.01.14 o godzinie 19:43
Kamila Maj

Kamila Maj Student, UMK

Temat: Jak sprawdzić korelację

super !! Dziękuję badzo za pomoc :)
Dominika K

Dominika K Studentka
biotechnologii

Temat: Jak sprawdzić korelację

Adrian O.:
PS3: nie ma tu zastosowania korelacja wieloseryjna (polyserial).

Dlaczego tutaj nie ma zastosowania skoro jedna zmienna jest na skali ilościowej a druga na skali jakościowej? Czy korelacja Spearmana nie jest tylko do zmiennych jakościowych?

Temat: Jak sprawdzić korelację

Nope.

Korelacja wieloseryjna wymaga jednej zmiennej o charakterze opisywanym często skrótem PPNDRN*, a drugiej dyskretnej powstałej przez zdyskretyzowanie nieobserwowanej wprost PPNDRN (jeśli druga też jest PPNDRN to możemy zastosować Pearsona).

* PPNDRN - 1) perfectly precise, 2) normally distributed, 3) real numbers

I tu jest najtrudniejszy moment. Zmienna dyskretna to NIE JEST zmienna jakościowa, lecz nadal ilościowa (zdyskretyzowana). Dyskretyzacja zachowuje cechy skali. Czym innym jest zmienna jakościowa "ocena w szkole", przybierająca wartości ze zbioru {1, 2, 3, 4, 5, 6}, gdzie można określić jedynie relację porządku (jedynie, bo 5ka nie jest 5 razy lepsza od pały, ani o 2 lepsza od trójczyny) a czym innym dyskretna skala szybkości chwilowej samochodu {10km/h, 20km/h, 30km/h, 40km/h...}, wywiedziona ze zmiennej ciągłej (szybkość mogła być dowolna, np. 13.23424km/h w pewnym przedziale) przetłumaczona na (1, 2, 3, 4), gdzie 4 to 4 razy więcej niż 1 i 4 to o 2 więcej niż 2.

Takich korelacji opartych o zmienne dyskretne jest cała masa: wieloseryjna, dwuszeregowa, polichoryczna, tetrachoryczna, dwuszeregowa-punktowa, wieloseryjna-punktowa.

Korelacja Spearmana jest dla zmiennych porządkowych (rang). Zawsze możesz przejść od skali mocniejszej do słabszej, prawda? Dzięki rangowaniu z badania liniowości przechodzisz do badania monotoniczności. Dlatego przy spełnieniu założeń Spearman ma mniejszą moc niż Pearson.Ten post został edytowany przez Autora dnia 17.01.14 o godzinie 03:21
Dominika K

Dominika K Studentka
biotechnologii

Temat: Jak sprawdzić korelację

Wydaje mi się że rozumiem. Czyli zmienna dyskretna to taka pocięta zmienna ciągła? Jak na histogramie, który jest taką pociętą krzywą gęstości? A czy zmienna rangowana to także zmienna dyskretna?

Temat: Jak sprawdzić korelację

Tak, taka pocięta ciągła. Tak, jak na histogramie.

Nie, zmienna rangowana to nie to samo. Kolejnym wartościom nadajesz kolejne, całkowite (lub "związane - ułamkowe") rangi. Zachowujesz porządek, tracisz informacje o "odstępie" i "stosunku". Rangowanie usuwa np. punkty odstające:

{1, 2, 3, 4, 10, 50, 1000, 10000} => {1, 2, 3, 4, 5, 6, 7, 8}



Wyślij zaproszenie do