Kamil Bęczyński

Kamil Bęczyński R, SAS, analizy

Temat: SAS i R

Na studiach miałem kilka przedmiotów, których celem było nauczenie się wykonywania analiz statystycznych przy pomocy SAS, nie było to trudne. Teraz postanowiłem trochę poważniej poznać SAS (jest masa ofert pracy), a konkretnie nauczyć się trochę więcej w 4GL, no i klapa :-/ do nauki użyłem kodów z zajęć od studenta z Politechniki Warszawskiej, czyli jakoś materiału jest raczej dobra, tylko pozbawiona komentarzy. R już trochę znam, VBA również, ale moja przygoda z SAS-em chyba nie potrwa zbyt długo.

4GL SAS'a jest dziwny, przynajmniej dla mnie, wygląda na jakiś deklaratywny język. Składnia została maksymalnie uproszczona, by zwiększyć czytelność kodu, ale przez to nie do końca mogę zrozumieć jakie obiekty są tworzone i gdzie są przekazywane, brak nawiasów, makra.

Słyszałem, że SAS ma wiele zalet w porównaniu z R, jeśli chodzi o manipulację danymi (na przykład natywny SQL), poza tym jest czymś więcej niż tylko pakietem statystycznym, chyba jednak nie dotrwam do momentu w którym się o tym przekonam :)

Jest dużo materiał w stylu - R dla użytkowników SAS, szkoda, że nie ma materiałów wprowadzających dla przypadku odwrotnego.

W sumie nie mam konkretnych pytań oprócz dwóch - czy można gdzieś znaleźć przyzwoicie opisany proces kompilacji kodu w SAS (opis na poziomie : co SAS rozumie przez dane polecenie, co tworzy i czego oczekuje) ? dlaczego używa się SAS'a ? - czy SAS jest rozwiązaniem gdy firma chce mieć jedno środowisko do wszystkiego i z jakichś powodów (cena ?) nie chce kupić jakiegoś dedykowanego systemu lub zamiast zamówić odpowiednio zaprojektowany dla niej system firma preferuje kupic SAS plus zatrudnić osoby które napiszą pod SAS'em odpowiednie aplikacje, bo wymagania co do systemu zmieniają się w tej firmie bardzo szybko

a i jeszcze jedno, czy używacie jednocześnie SAS'a i R'a ? jeśli tak, to co robicie w pierwszym, a co w drugim ?

Pozdrawiam

edycja :
zamiast dziwny powinienem napisać raczej, że jest dla mnie nieintuicyjnyKamil B edytował(a) ten post dnia 19.03.12 o godzinie 20:44

konto usunięte

Temat: SAS i R

Czy 4GL jest dziwny to nie wypowiem się, nie jest to na pewno język obiektowy.
Czym jest SAS? Jest to system, a więc nie ma co porównywać go do R. SAS pozwala na integracje danych z różnych źródeł, ogólnie zarządzanie całym procesem ETL. Ma narzędzia do czyszczenia danych, tworzy kostki OLAP, ma rozbudowany system dostępu i kontrolą uprawnień do danych czy funkcjonalności. Jak sam napisałeś ma rozbudowane możliwości statystyczne i analityczne.
Większość z procedur (nawet sql jest w PROC SQL) można wywołać na serwerze. Pamiętaj jednak że często to nie jest jednakowa akcja analityka, analizy są powtarzane cyklicznie, wyniki są też wykorzystywane produkcyjnie. Można zastosować kilkanaście procedur samemu, ale jest coś takiego jak SAS Enterprise Miner gdzie przetwarzanie jest podzielone na logiczne bloki, proponuję się zapoznać z metodyką SEMMA. Wiem że SAS jest silnie wykorzystywane w USA w medycynie, może i ma dodatkowe narzędzia, ja akurat nic o tym nie wiem :)
Piszesz R ale tak naprawdę masz na myśli pakiety pisane przez specjalistów, pasjonatów, studentów z różnych uczelni rozsianych na całym świecie. Ma to oczywiście swoje niezaprzeczalne zalety, ale i na tym forum znajdziesz głosy krytyczne co do kodu w co poniektórych pakietach. Ale taki system szybciej reaguje na nowinki i zapotrzebowanie. A SAS to firma która ma wszystko w jednym miejscu i zarządza funkcjonalnością, czasami podkupuje (proc X11 dataflux) ale tak robią wszystkie duże firmy, co można samemu co nie to kupić dopóki nie zrobi tego ktoś inny.
Mi na razie w SAS brakuje gotowych kodów do ekonometrii i statystyki przestrzennej, R to już ma :)
Maciej B.

Maciej B. Doktorant

Temat: SAS i R

Mi się SASowy 4GL podoba, jest całkiem przystępny i jedną komendą można dużo rzeczy zrobić (np. testować kilka modeli regresji czy time series). SAS nadal będzie wybierany przez firmy m.in. ze względu na hotline czy całe wsparcie, którego R nie ma i nie będzie miał. Tak jak napisał Pan Krzysztof firmy kupują cały pakiet (BI + Hurtownie Danych + Support) i dlatego się dla nich to opłaca.

Ale i SAS widzi, że R jest dobrą platformą, np. jest możliwość pisania kodów R w poleceniu PROC IML.

Co do ekonometrii przestrzennej to muszę się zgodzić, niestety do takich analiz trzeba poszukać makr, które są udostępniane na SAS Support albo korzystać z R. Z tego co pamiętam dopiero niedawno wprowadzono proc variogram ale GWR jeszcze nie ma zaimplementowanego. Za to można robić fajne interaktywnie wizualizacje na mapach (drill down itp.).
Kamil Bęczyński

Kamil Bęczyński R, SAS, analizy

Temat: SAS i R

Trochę dziwi mnie, że nie ma dostępnych książek o SASie w języku polskim, a o R są, chociaż wydaje mi się być mniej popularny, może to z powodu popularności R w środowisku akademickim, a nawet można się już z R spotkać na wielu kierunkach studiów - chemii, ekonomii, biologii.

konto usunięte

Temat: SAS i R

Kamil B:
Trochę dziwi mnie, że nie ma dostępnych książek o SASie w języku polskim, a o R są,
Wątek jest o R a nie o SAS :), ale jeśli to odniosę się do tej kwestii.
To nie do końca że nie ma, są pozycje SGH pani dr Frączak, są bez wątpienia też innych wydawnictw. Ale po prostu natura R jest inna, to platforma otwarta, każdy może napisać pakiet jak i podręcznik, to dzieło poniekąd pasjonatów. SAS, Oracle, DB2 (IBM), to produkty komercyjne, masz olbrzymie wsparcie tych firm, masz dużą paletę dokumentów, podręczników, tutoriali, opisów właśnie wyprodukowanych przez te firmy. Oczywiście są i książki z poza tych instytucji, np. wydawnictwo Helion, ale wydawnictwo kieruje się rachunkiem ekonomicznym, jest zbyt to wypuści pozycję. Pamiętaj też co pisałem, mówisz R myślisz o pakietach, mówiąc SAS myślisz o SAS :)
Do R masz książki, trochę wstępu o samej architekturze, trochę o operacjach na danych, wektorach, ramkach danych. Ale reszta to zastosowanie konkretnego pakietu do konkretnych zadań.

konto usunięte

Temat: SAS i R

Serdecznie zapraszam wszystkich zainteresowanych tematyką systemu SAS do wymiany materiałów uczelnianych,
http://www.goldenline.pl/forum/2953134/wymiana-materia...

Następna dyskusja:

'Take the SAS to R challenge!'




Wyślij zaproszenie do