Temat: standardised coefficients
Bety standaryzowane wyliczane są dla zmiennych standaryzowanych, a bety niest. - dla danych niestandaryzowanych.
W regresji wielu zmiennych współczynniki (bety - choć radzę unikać tego określenia) interpretujemy w oparciu o "jednostkowe zmiany" odpowiednich zmiennych niezależnych. Dane niestandaryzowane mierzone są w ich jednostkach pomiaru (np. m, kg, Hz, etc.). Dane standaryzowane mierzone są w jednostkach ich odchyleń standardowych.
Patrząc na powyższe, raz są to zmiany w jednostce pomiaru (np. zmiana o 1 km), a raz w jednostce SD (zmiana o 1SD dla tej zmiennej).
Toczą się długie dyskusje na temat tego, czy operowanie zmiennymi std. pomaga czy nie pomaga w porównaniach, ale jedno jest pewne: w przypadku regresji liniowej, o ile różnice w skalach nie są tak duże, by powodować problemy numeryczne, nie trzeba standaryzować danych. Są algorytmy, gdzie takie i podobne zabiegi są konieczne (np. w dataminingowym algorytmie k-najbliższych sąsiadów), ale nie tutaj. Standaryzacja danych to transformacja liniowa (ax+b) i nie zmienia ona rozkładu danych, nie przyniesie różnic w stosunkach t/S a więc i istotności (pval) zmiennych (choć wpływa na komponenty wariancyjne). Bety std. i niestd. można konwertować między sobą.
Można więc spokojnie pracować na danych niestandaryzowanych i podawać bety niestandaryzowane. Do równania można podawać i to i to, ale trzeba to potem umieć zinterpretować :)
Adrian Olszewski edytował(a) ten post dnia 24.07.11 o godzinie 01:25