konto usunięte
Temat: Superkomputer w zastosowaniach GIS - warto?
Witam wszystkich.W pracy padła propozycja zakupu superkomputera, konkretnie jednej z trzech wersji Cray CX1:
* Cray CX1 System
* Cray CX1-LC System
* Cray CX1-iWS System
Najlepiej zajrzeć do Brochure (na dole każdej z ww. stron) w celu zapoznania się z rozszerzonymi opisami jednostek.
Jak widać, nie jest to typowa stacja robocza, a raczej... wszystko w jednym. Znajdzie się tam miejsce na max. 24 procesory Intel Xeon, gigabitowy switch ethernetowy, dwa systemy zasilania, kontroler RAID i SCSI. Wedle opisu jest to zamknięty w jednej obudowie klaster, może być wykorzystywany przez wielu użytkowników do pracy poprzez, jak to ładnie producent ujął, "accessing shared clustered resources". Jednocześnie można w tym czasie używać go jak zwykłej stacji roboczej single-user.
Teraz moje pytania.
Przede wszystkim, czy jest w ogóle sens kupienia tego (nie znam ceny, choć to na razie nieistotne), jeżeli będzie tam uruchomiany w zasadzie tylko ArcGIS 9 Desktop i ERDAS Imagine 8 (ewentualnie ERDAS 9)?
Śmiem twierdzić, że w ogóle nie warto w to wchodzić. Mam jednak pewne wątpliwości.
Jest to w całości platforma 64-bitowa, a więc biedny ArcGIS, jako aplikacja natywnie 32-bitowa, zgodnie z wiedzą Dominika Mikiewicza i informacjami na esri.com, nie będzie w stanie zaadresować >2 GB pamięci wirtualnej (RAM + swap) na jeden wątek procesora. Nie wiem, jak ERDAS sobie radzi.
Ponadto ArcGIS, mimo że wspiera procesowy wierordzeniowe i stacje wieloprocesorowe, to nie wykorzystuje ich potencjału, gdyż jedna instancja programu korzysta tylko z jednego wątku procesora.
Dlatego chciałbym się od Was dowiedzieć, czy dałoby się na takiej maszynie wykorzystać zaimplementowany w niej klaster do obliczeń w taki sposób, aby sam zaprzęgnął dostępne zasoby sprzętowe do pracy? Mam na myśli coś w rodzaju emulacji - ArcGIS widzi jeden procesor, natomiast oprogramowanie dzieli zadanie na "wirtualne podprocesy" i każdy z nich przydziela innemy fizycznemu rdzeniowi. Pytam, bo nie znam się zupełnie na klastrach. Jestem tylko geografem ;)
Ponadto piszemy własne aplikacje w ModelBuilderze z ArcGIS oraz ArcGIS Engine. Znalazłem przykładowe narzędzie Parallel Geoprocessing in ArcGIS Desktop with Python, które przy użyciu skryptów Pythona potrafi natywnie działać wielowątkowo, czyli bezpośrednio odwołać się do rdzeni procesora.
Biorąc pod uwagę możliwość zmuszenia ArcGIS do pracy wielowątkowej, zakup superkomputera nie wydaje się już tak szalonym pomysłem, jak na początku sądziłem. Mimo to dalej jestem sceptycznie nastawiony do tej "inwestycji". Co o tym myślicie?
Jak jest z wielowątkowością w innym oprogramowaniu GIS? Pytam zarówno o to komercyjne, jak i darmowe. Interesuje mnie zwłaszcza GDAL.
Co wiecie nt. Windows 2008 HPC Server (HPC = High Perpormance Computing)? W ESRI Support na jego temat nie ma słowa. Zwykły Server 2008 (bez HPC) jest obsługiwany.
A może dałoby się wykorzystać ten komputer do wspomagania operacji wykonywanych na stacjach roboczych użytkowników, którzy łączyliby się z nim przez sieć? Tak, żeby były tylko maszynami zlecającymi prace obliczeniowe klastrowi.
Myślimy także nad postawieniem ArcGIS Servera, czy na wspomnianym wyżej superkomputerze ma to sens?
Od razu chcę zaznaczyć, że ewentualny potencjał obliczeniowy maszyny jesteśmy w stanie wykorzystać (oczywiście nie mamy zamiaru kupować najbogatszej wersji, na początek wystarczyłoby mniej niż 10 rdzeni, można w razie potrzeby dokupić gotowe moduły, które od razy można włożyć do obudowy). Wykonujemy dużo obliczeń związanych z modelowaniem i symulowaniem zjawisk w przestrzeni, ciągle tworzymy nowe aplikacje, które będą potrafiły spożytkować chyba każdą moc obliczeniową.
Poza tym nie napalamy się na te akurat modele, to są przykładowe komputery. Jeżeli upewnimy się, że tej klasy sprzęt naprawdę nam się przyda, to będziemy szukać maszyny o odpowiednim stosunku ceny do jakości.
Z góry dziękuję za wasze odpowiedzi i pozdrawiam,
Łukasz