Joanna J.

Joanna J. Ryzyko kredytowe,
Bank Pekao S.A.

Temat: Model regresji logistycznej

Chce zbudowac model regresji logistycznej w Sasie. Dokonałam kategoryzacji wszystkich zmiennych, których chcę użyć w modelu w ten sposób, że np. posiadając 5 atrybutów zmiennej - atrybut o numerze 1 - to najgorsza klasa, natomiast atrybut z numerem 5 - najlepsza. Procedura Logistic w Sasie daje mi możliwość rozkodowania każdej zmiennej na zmienne zero - jedynkowe przy użyciu instrukcji Class, jednak nie wiem jak później wyplątać z tego punktację do karty scoringowej np. na skali 0 -100 pkt. To znaczy wiem, że korzystając z oszacowanych parametrów mam informację o ile zmienni się prawdopodobieństwo sukcesu w porównaniu z poziomem bazowym, tylko w jaki sposób mam ustalić punktację dla tego poziomu bazowego?

Z tego co wiem można te kategorie przetransformować na punkty, znormalizować te punkty dla każdej każdej zmiennej i na takich zmiennych zbudowac model regresji logistycznej, bez użycia Class. Tylko nie wiem jak w praktyce dokonuje się takiej transformacji w Sasie czy wówczas jest używana procedura Reg, Score, a może Factor i jak dalej postąpić, aby zbudowac kartę scoringową. Czy w ogóle postępowanie w taki sposób nie jest najlepszą metodą?a w momencie nadawania scorów poszczególnym kategoriom i tak trzeba będzie użyć instrukcji Class w procedurze Logistic, aby wiedzieć jak zmiana kategorii wpływa na modelowane zjawisko, czy robiąc regresję logistyczną na znormalizowanych scorach oszacowane parametry informują nas tych zmianach(podobnie jak w przypadku zmiennych ilościowych)?
Procedura Score chyba raczej wykorzystywana jest do nadania punktacji do zbioru testowego?.

Porównując modele zbudowane dla wybranych zmiennych - model z mniejszą ststystyką AIC jest lepszy? (podobnie jest z - 2LogL?).

Bardzo proszę o pomoc w powyższych kwestiach.

Pozdrawoam,
Joanna Jmeioł