Temat: Hurtownie danych w bankowości - ankieta
Robert Woźniak:
Jeżeli chodzi o wydajność to wiadomo, że trzeba na to uważać. Denormalizować i jeszcze raz denormalizować, a wszystko będzie dobrze :) .. tylko kto to później będzie utrzymywał! :) A tak serio, to oczywiście że każda branża ma swoje własne ciekawe struktury.
Denormalizacja (jeżeli mówimy o procesie odwrotnym do normalizacji - doprowadzenia do postaci normalnych jakiegoś rzędu) w przypadku HD ma jeszcze jeden aspekt, możemy stracić możliwość identyfikacji obiektów a wtedy to już mamy kosmos.
Jeżeli o chodzi o wymiary typu MPK (miejsce powstawania kosztów) to obecnie nie tylko Bankowość ma taką, np. w telekomach jest tak samo. Jak dla mnie ciekawe Hurtownie to się buduje w Energetyce, np. wymiar czasu z zejściem do minuty.
Tak i zapomniałeś dodać, że nad minutami są jeszcze kwadranse no i rzeczywiście tam to są dopiero struktury do modelowania, niedawno robiłem projekt dla energetyki także wiem o tym małe co nieco.
Nie chciałem straszyć kolegi od mgr, ale skoro temat został poruszony to można zwrócić uwagę na kilka rzeczy związanych z MPK:
- jak uporamy się ze strukturą organizacyjną to należy założyć że koszty mogą rozchodzić się po różnych działach czyli MPK nie musi być tożsame ze SO;
- również pojedynczy koszt np. faktura może być rozbita na różne MPK (np. firma kupuje soft używany przez dwa różne działy);
- koszt może się również składać z wielu płatności (i płaci za powyższe w ratach);
- jeżeli w jakiś sposób liczymy stopę zwrotu z inwestycji to może się okazać, że na soft zarabia np. dział handlowy, który z niego nie korzysta bezpośrednio ale pośrednio;
- no i na koniec przydałby się system do zarządzania projektami (ale to już zupełnie inny kosmos).
Także proste rzeczy dość szybko nam się komplikują nie mówiąc już o innych systemach np. bilingi itp.
Co do bankowości to należy pamiętać, że obszar danych jest tam ogromny i stosuje się w większości przypadków szereg Hurtowni Tematycznych (Data Marts).
Zależy od podejścia i technologii jaką się wykorzystuje, osobiści robię to na kostkach OLAP i dopiera na ich bazie buduję dedykowane agregaty (Data Marts).