Wojciech Blicharski

Wojciech Blicharski Planista - Analityk

Temat: Kurtoza. Interpretacja

Drodzy Koledzy/ Koleżanki

Pomóżcie bo zgłupiałem.
Jak interpretujemy kurtozę.
Koleżanka zadała mi pytanie:
Współczynnik koncentracji (kurtoza 3) VO2 max dobranych losowo do badań piłkarzy jest równy -4,2. Zinterpreruj wynik

Pomóżcie. przyznaję, wstydzę się pytać.

Temat: Kurtoza. Interpretacja

Rzuć okiem na ten wątek na grupie dla użytkowników pakietu "R" (flame'a - pomiń) :)

http://www.goldenline.pl/forum/2922258/jak-wygenerowan...

W kolejnych postach masz wyjaśnione, jak ją interpretować. Jest to stopień koncentracji obserwacji wokół średniej w ramach danej zmienności. Mówiąc na chłopski rozum - czy dane są bardziej w centralnej części rozkładu, czy w ogonach :)

Excess (K-3) dla rozkładu normalnego wynosi 0. Rozkład jednostajny to tak w okolicy -1.2. Rozkład beta "U" to -1.8. Granicznie można dojść w okolice -2 (czyli K w okolice 1). Pojęcia nie mam, co oznacza Excess równy minus... 4 (lub inaczej std. kurtoza mniejsza od -1, nie mówiąc o mniejszej od zera).

Tak by wyglądał rozkład danych o excesie -1.9 (czyli kurtozie=1.1). Niżej nie udało i się zejść.

Obrazek


Patrząc na klawiaturę numeryczną - może omsknęła się jej ręka i chodziło o -1.2? Wtedy rozkład byłby zbliżony do jednostajnego.


Obrazek
Adrian Olszewski edytował(a) ten post dnia 22.06.12 o godzinie 14:34

Temat: Kurtoza. Interpretacja

Tak, -4,2 to musi być błąd.
Kurtoza (excess kurtosis) ma dopuszczalne wartości od -2 do +nieskończoność.
Kurtozę -2 ma rozkład Bernoulliego o p=0.5. Niższa wartość nie jest możliwa.

Temat: Kurtoza. Interpretacja

Hmm, ale jednak coś mnie tknęło, żeby sprawdzić teorię w praktyce i spojrzeć na implementację kurtozy w aplikacjach. I okazuje się, że np. w SPSS używany jest zmodyfikowany wzór ważący wszystko w dosyć skomplikowany sposób. W każdym bądź razie klucz do bardzo niskich wartości jest tutaj: w mianowniku kwadrat wariancji jest ważony przez iloczyn (W-3)*(W-2)*(W-1), gdzie W to suma wag obserwacji (liczebność próby w przypadku danych nieważonych).

W rezultacie przy wzorze używanym w SPSS dolna granica kurtozy jest przesunięta do -6 (dla następującego wektora: 0, 0, 1, 1) .

W R sprawdziłem dwa pakiety: PerformanceAnalytics i e1071. Oba mają podobne modyfikacje (tym razem jednak dzielenie przez N-1) i dolną granicę kurtozy (wektor dwóch wartości: 0, 1) przesuniętą do -2,75.

Więc jednak kurtoza -4,2 ma interpretację :) I to niespodziewanie bardzo ścisłą: z bardzo dużym prawdopodobieństwem mamy do czynienia ze zbiorem dokładnie 4 obserwacji.

Temat: Kurtoza. Interpretacja

No to albo mamy zadanie-łamigłówkę, albo pomyłkę... Tertium non datur...

Następna dyskusja:

pomoc do pracy mgr - statys...




Wyślij zaproszenie do