Temat: Czas ładowania HD

Witam,
Coś nic się nie dzieje na grupie, nie wiem, czy mogę zadać pytanie czysto techniczne.
Otóż tak jak mam w opisie jako pracę inżynierską projektuję HD z procesami ETL oraz warstwą prezentacji. Szkielet mam już mniejwięcej dopracowany, przynajmniej tak mi się wydaje, jednak chciałem się zorientować, czy czas ładowania nie jest zbyt długi.
Bazę Oracle 10gR2 oraz Warehouse Buildera mam odpalone na Celeronie Mobilnym 1,4 z 756 MB ramu, wiem wiem, ze to kiepska maszyna do takich zastosowań, no ale ...
No więc zaczynam od ładowania wymiaru czasu z dokładnością do sekund, plik od początku notowań giełdowych ma 1,7GB, czyli tak na dobrą sprawę nie tak dużo.
Dane przechodzą z tabeli zewnętrznej, przez wyrażenie łączące datę i godzinę do typu timestamp, pozniej są deduplikowane i kolejnym wyrażeniem zawierającym funkcje to_char rozrzucane są po wymiarach.
I tak sie zastanawiam, czy 200 tys rekordów z 35 mln powinno się ładować 4 godziny? czy może coś w ustawieniach mapowania, tabel zewnętrznych, czegokolwiek mogę mieć źle skonfigurowane?

Co o tym sądzi grono praktyków HD? :)

Temat: Czas ładowania HD

200 k /4* 60min = 833 rek/min mało :(

Ale tutaj wąskim gardłem jest prawdopodobnie wydajność dysku.
Z tego co pamiętam na 1 GB wrzuconych do tabeli danych ORACLE tworzy 10 GB archivelogów i gdzieś/kiedyś to trzeba zapisać
Sprawdź ile RAMu faktycznie przydzieliłeś ORACLE (bo może mieć jej za mało). Inny pomysł to wyłaczyć transakcje przy ładowaniu danych.





Piotr Wolański edytował(a) ten post dnia 06.03.07 o godzinie 19:46

konto usunięte

Temat: Czas ładowania HD

Spróbuj także wyłączyć weryfikowanie kluczy obcych, oczywiście przy założeniu, że dane są w pełni integralne.

Temat: Czas ładowania HD

Tymaczasowo troszke jestem w tyle, gdyż postawiłem sobie dodatkowy serwerek na CentOS'ie i wyszły mi lekki problemy sprzętowe, najpierw z sieciówką, teraz z dyskiem.
Ale już niebawem bedę testował rozwiązania.
Dziękuję za sugestie.


Jarosław Dobromiski edytował(a) ten post dnia 15.03.07 o godzinie 23:37
Łukasz Kociuba

Łukasz Kociuba Partner Manager at
Algolytics

Temat: Czas ładowania HD

Witaj,
Przetestuj trochę szybsze rozwiązanie:

SAS Press Release | SAS, Sun Microsystems establish new data integration performance world ...
http://www.sas.com/news/preleases/051706/news8.html

New DI Performance World Record
http://www.sas.com/news/feature/29may06/direcord.html

SAS® Enterprise ETL Server Sets World Record
http://www.sas.com/news/feature/22mar05/etl.html

SAS Press Release | SAS smashes ETL world record while establishing new, real-world benchmarks
http://www.sas.com/news/preleases/041707/news9SASSUN.html

SAS Press Release | New release of SAS® Enterprise ETL Server sets performance world record
http://www.sas.com/news/preleases/032105/news1.html

SAS Press Release | Unisys and SAS Deliver Record-breaking ETL Benchmark Result
http://www.sas.com/news/preleases/041805/news1.html

Pozdrawiam,
LK
Marcin Stryjczak

Marcin Stryjczak Consultant at
Business
Intelligence area

Temat: Czas ładowania HD

Cześć,
ja również dołączam się do sugestii, że najbardziej spowalnia tu... dysk, którego niestety pamięcią nie nadgonisz, bo masz jej mało.
Sprawdź czy masz założone indeksy oraz klucze obce - ich zdjęcie powinno przyspieszyć proces.

Pozdrawiam,
Marcin

konto usunięte

Temat: Czas ładowania HD

Dobry.

Ja był zaczął od sprawdzenia czegoś takiego jak "AUTOCOMMIT" ;)

Jak patrzę na procesor, to pewnie twoja maszyna ;) "była" z niższego przedziału cenowego, co pewnie owocuje tym, że dysk też był stosunkowo tani. Problem w tym, że jak źle trafisz, to pracujesz na dysku, który może wysłac informację do 10g o fizycznym zapisaniu na dysk a nie koniecznie będzie to prawda ( nawiązuję do transakcji ).

Sergiusz: A nie lepiej załozyc je pózniej ?

Łukasz, ;) rozumiem, że to twoja praca.. ale jak ma gotowe to po co zmieniac?

Pozdrawiam.Rafał Wardas edytował(a) ten post dnia 02.07.08 o godzinie 00:11

Następna dyskusja:

Czas na SAFARI... po Polsku ;)




Wyślij zaproszenie do