Temat: modele scoringowe
Przepraszam Panie Rafale, nie chcę Pana urazić swoim pytaniem, ale jak Pan definiuje Data Mining? Mam wrażenie, że nie mówimy o tym samym. Ja znam niestety tylko takie definicje Data Miningu, w których mowa jest o wyszukiwaniu biznesowo użytecznych wzorców w olbrzymich zbiorach danych. Ważny jest zatem efekt, który można skonsumować. Efektem jest zatem realizacja kampanii (a nie raport). Ewentualnie dostarczenie skoringu typującego do kampanii. Ale to już problem kompetencji - kto ma wdrażać. (Oczywiście "kampania" to takie słowo wytrych, bo w istocie rzeczy chodzi po prostu o wdrożenie wiedzy do praktycznej realizacji, czegokolwiek by ta wiedza nie dotyczyła).
W każdym razie, dla mnie budowanie modelu zaczyna się już na etapie definiowania obszarów danych w hurtowni, które potencjalnie mnie interesują. A taki dobór obszarów danych mogę przeprowadzić tylko mając wyobrażenie na temat potencjalnych zależności. W późniejszym etapie skupiam się na odrzuceniu danych bezwartościowych (jakość,artefakty) i wyborze cech potencjalnie istotnych. W praktycznym sensie testuję różne modele, zwracając szczególnie uwagę na te o najwyższej skuteczności (one są najgroźniejsze).
Stosuję zasadę "brzytwy Okhama" i zasadę "cost effectiveness"
Pozwolę sobie jeszcze raz podkreślić rolę metodologii/metodyki. Bez uporządkowania procesu łatwo ponieść niepotrzebne koszty, np. "przemycić" do modelu dane bezwartościowe, co spowoduje niemożność wykorzystania modelu w praktyce.
Odjechałem nieco od zagadnienia skoringu, ale mam nadzieję, że mnie Panowie zrozumiecie. Dla mnie DM jest procesem, gdzie poszczególne etapy ściśle od siebie zależą.
Pozdrawiam