Joanna J.

Joanna J. Ryzyko kredytowe,
Bank Pekao S.A.

Temat: Model regresji logistycznej

Chce zbudowac model regresji logistycznej w Sasie. Dokonałam kategoryzacji wszystkich zmiennych, których chcę użyć w modelu w ten sposób, że np. posiadając 5 atrybutów zmiennej - atrybut o numerze 1 - to najgorsza klasa, natomiast atrybut z numerem 5 - najlepsza. Procedura Logistic w Sasie daje mi możliwość rozkodowania każdej zmiennej na zmienne zero - jedynkowe przy użyciu instrukcji Class, jednak nie wiem jak później wyplątać z tego punktację do karty scoringowej np. na skali 0 -100 pkt. To znaczy wiem, że korzystając z oszacowanych parametrów mam informację o ile zmienni się prawdopodobieństwo sukcesu w porównaniu z poziomem bazowym, tylko w jaki sposób mam ustalić punktację dla tego poziomu bazowego?

Z tego co wiem można te kategorie przetransformować na punkty, znormalizować te punkty dla każdej każdej zmiennej i na takich zmiennych zbudowac model regresji logistycznej, bez użycia Class. Tylko nie wiem jak w praktyce dokonuje się takiej transformacji w Sasie czy wówczas jest używana procedura Reg, Score, a może Factor i jak dalej postąpić, aby zbudowac kartę scoringową. Czy w ogóle postępowanie w taki sposób nie jest najlepszą metodą?a w momencie nadawania scorów poszczególnym kategoriom i tak trzeba będzie użyć instrukcji Class w procedurze Logistic, aby wiedzieć jak zmiana kategorii wpływa na modelowane zjawisko, czy robiąc regresję logistyczną na znormalizowanych scorach oszacowane parametry informują nas tych zmianach(podobnie jak w przypadku zmiennych ilościowych)?
Procedura Score chyba raczej wykorzystywana jest do nadania punktacji do zbioru testowego?.

Porównując modele zbudowane dla wybranych zmiennych - model z mniejszą ststystyką AIC jest lepszy? (podobnie jest z - 2LogL?).

Bardzo proszę o pomoc w powyższych kwestiach.

Pozdrawoam,
Joanna Jmeioł
Joanna J.

Joanna J. Ryzyko kredytowe,
Bank Pekao S.A.

Temat: Model regresji logistycznej

Witam, ostatecznie zbudowałam model regresji logistycznej rozkodowując skategoryzowane zmienne na zmienne zero - jedynkowe przyjmując za poziom bazowy kategorię „1”. Modelowałam prawdopodobieństwo defaultu.
Teraz chciałabym zbudować kartę scoringową wykorzystując otrzymane wyniki, jednak nie do końca wiem jak to zrobić (np. skala 0-100).

Mając np. poniższą zmienną:
Analysis of Maximum Likelihood Estimates
Parameter DF Estimate Standard
Error Wald
Chi-Square Pr > ChiSq
Intercept 1 1.8603 0.2206 71.1381 <.0001
konto_lata 2 1 -0.6813 0.0396 295.9683 <.0001
konto_lata 3 1 -1.0986 0.0422 677.5646 <.0001
konto_lata 4 1 -1.4422 0.0519 772.5322 <.0001
konto_lata 5 1 -1.8546 0.0499 1382.1664 <.0001

Odds Ratio Estimates
Effect Point Estimate 95% Wald
Confidence Limits
konto_lata 2 vs 1 0.506 0.468 0.547
konto_lata3 vs 1 0.333 0.307 0.362
konto_lata 4 vs 1 0.236 0.214 0.262
konto_lata 5 vs 1 0.157 0.142 0.173

Rozumiem, że 1 tabela oznacza wpływ zmiany kategorii na prawdopodobieństwo niewypłacalności w porównaniu do kategorii bazowej, „-" oznacza kierunek zmian, w tym przypadku zmiana kategorii powoduje spadek prawdopodobieństwa defaultu? Natomiast druga oznacza o ile zmienia się stosunek „złych”/”dobrych” klientów dla kolejnej kategorii w porównaniu do 1. Czy muszę najpierw powrócić do oszacowań modelu LPM i z tego wyplątać punktację?

Bardzo proszę o pomoc w interpretacji tych parametrów, coś się w tym pogubiłam i dlatego kwestia utworzenia karty scoringowej jest tym bardziej dla mnie skomplikowana.

Jeżeli zechciałby ktoś mi pomóc proszę o kontakt, potrzebuję konsultacji i pomocy.

Pozdrawiam.
JJ
Marcin Marcin

Marcin Marcin ....nie oczekuj
lepszych rezultatów
jeżeli wciąż robisz
t...

Temat: Model regresji logistycznej

czy udało się rozwiązać problem ?

Następna dyskusja:

Dopasowanie modelu regresji...




Wyślij zaproszenie do