Wojtek
Jurewicz
ETL and Database
Developer / Business
Intelligence
specia...
Temat: Zarządzanie źródłem danych w hurtowni
Prawdopodobnie nieumiejętność właściwego doboru tematu jest powodem niemożności odnalezienia źródeł w internecie, ale może ktoś będzie w stanie mi z tym pomóc.W skrócie: dane ładowane do hurtowni danych pochodzą z różnych źródeł, po drodze poddawane są licznym transformacjom a na końcu lądują w postaci wpisu w jednej kolumnie którejś z tabel. Chciałbym w miarę elastycznie zarządzać tą ścieżką we współpracy z osobami odpowiedzialnymi za systemu źródłowe, tzn. chciałbym wiedzieć dokładnie kiedy i w jaki sposób zmiana w strukturze danych systemu źródłowego wpłynie na strukturę / postać danych w hurtowni.
Dla przykładu, docelowa kolumna ENGINE_CAPACITY w tabeli DIM_CARS pochodzi z systemu CARPOOL@companydomain, gdzie znajduje się w tabeli COMPANY_VEHICULES w kolumnie V_PAR_1 w wierszach posiadających wartość "CAR" dla kolumny VH_CLASS. W związku z update-m systemu dana ta znajduje się teraz w tej samej tabeli, ale w kolumnie V_PAR_2 w wierszach posiadających wartość "SMALL_CAR" lub "BIG_CAR" dla kolumny VH_CLASS. Zmiana ta ma wpływ na wspomnianą na początku kolumnę ENGINE_CAPACITY w tabeli DIM_CARS, przez co wymagana jest aktualizacja procesów ETL.
Chciałbym móc prowadzić listę tabel i kolumn w hurtowni wraz z ich źródłem tak, abym po takich zmianach w źródłach mógł łatwo ocenić jaki mają wpływ na hurtownię, oraz zaktualizować odpowiednie procesy. Wiem, że popularnym narzędziem do tego jest arkusz Excel-owy, ale nie tego szukam, znacie jakieś inne użyteczne narzędzia mogące pomóc w tej kwestii - zarówno darmowe jak i komercyjne?