Kamil Bęczyński

Kamil Bęczyński R, SAS, analizy

Temat: Programowanie w R

Nigdy nie uczyłem się programowania, jednak podczas korzystania z programu R jest mi ono bardzo potrzebne. Od czego powinienem zacząć, przeglądałem kilka książek ang. o programowaniu, czy nie ma jakichś materiałów po polsku ? Wszystkie, które znajduje, dotyczą wprowadzenia do R (jak utworzyć wektor, wybrać element, zbudować macierz itd.) i są bardzo krótkie, po trzech stronach prostych przykładów przechodzą do tematu tworzenia rysunków. Pozostała część to wprowadzenia do konkretnych pakietów R.
Na przykład z jakich materiałów mógłbym się dowiedzieć o istnieniu funkcji rle() ? Z przeglądania kolejnych funkcji pakietu base i help do nich czasem niewiele można wynieść, opis jest czasami po prostu zbyt ascetyczny.

Jeżeli możecie, to podpowiedzcie jakie materiały w języku polskim i angielskim o programowaniu w R uważacie za wartościowe i okazały się wam przydatne. Mogą to być książki i skrypty, strony. Nigdy nie natknąłem się na wstęp do programowania w R po polsku, do popularnych języków programowania takie materiay istnieją.
Pozdrawiam

Temat: Programowanie w R

Quick R - podstawowe metody statystyczne w R oraz manipulowanie danymi w strawnej postaci.

R Tutor - jak sama nazwa wskazuje :) Strona podobna do powyższej w swej idei, ale zdecydowanie uboższa tematycznie.

Łukasz Komsta - Wprowadzenie do R

Przemysław Bięcek - Na przełaj przez data mining z R

Podstawowe informacje ogólnym modelu liniowym (regresja i analiza wariancji, kowariancji), wiele uwag technicznych i merytorycznych

Ponadto bardzo polecam książki:

"R Book", czyli podstawowa "Biblia" do eRa, niestety, nieco droga, ok. 300zł, po angielsku.

Statystyczna analiza danych z wykorzystaniem programu R - dla bardziej zaawansowanych statystyków, polecam.

Metody ilościowe w R. Aplikacje ekonomiczne i finansowe - Po prostu "must have". Świetna robota m.in. jednej z forumowiczek GL, Pani Katarzyny Kopczewskiej.

Przemysław Bięcek - Przewodnik po pakiecie R, Księgarnia

Przykładowe rozdziały: http://www.biecek.pl/R/R.pdf

Co do "skąd mogę się dowiedzieć" - ja po prostu wpisuję w Google słowa opisujące problem, którego potrzebuję (nieraz wymaga to sporej ekwilibrystyki w doborze słów kluczowych), czasem dopisuję słowo "forum" albo PDF. Czasem, zanim dotrę do tego, czego potrzebuję, idę jak po nitce do kłębka. Potem, jak już znam funkcję, wpisuję sobie jej nazwę i przeglądam jej kod. Nie zawsze go rozumiem, ale i tak jest to bardzo pouczające (uczenie na przykładzie). Help do R zakłada jednak jakąś tam znajomość zagadnień statystycznych, albo dostęp do książek referencyjnych (chociaż niektóre z tych pozycji są już białymi krukami (np. te Siegela i Castellana) kosztują obecnie po kilka tysięcy zł...). A skąd o tym wiedział ktoś inny? Nie mam pojęcia :P Może z kursów, może z jakiejś grupy dyskusyjnej, może z jakiejś książki, może zna autora funkcji.

-------------------------

Warto dodawać nowe pozycje polskiej literatury o R do Wikipedii:
http://pl.wikipedia.org/w/index.php?title=R_(j%C4%99zy...Adrian Olszewski edytował(a) ten post dnia 18.04.12 o godzinie 20:40
Marek K.

Marek K. Spec. ds. Analiz
Finansowo-Handlowych

Temat: Programowanie w R

Adrian Olszewski:
Statystyczna analiza danych z wykorzystaniem programu R - dla bardziej zaawansowanych statystyków, polecam.

Posiadam. Również polecam. Nie uważam natomiast, że przeznaczona jest dla bardziej zaawansowanych statystyków. Fakt - nie wprowadza podstawowych pojęć, wzorów itp. ale zakładam że autor pierwszego posta ma za sobą jakąś formę podstawowego kuru statystyki.
Metody ilościowe w R. Aplikacje ekonomiczne i finansowe - Po prostu "must have". Świetna robota m.in. jednej z forumowiczek GL, Pani Katarzyny Kopczewskiej.

Pełna zgoda, choć widać nastawienie na analizę danych głównie ekonomicznych. Wraz z wymienioną wyżej książką bardzo dobrze się uzupełniają. Przynajmniej w zakresie który mi jest potrzebny.
Co do "skąd mogę się dowiedzieć" - ja po prostu wpisuję w Google słowa opisujące problem(...).

Nie wiem czy umieszczenie tej informacji jest to zgodne z regulaminem forum(jeśli nie jest to pewnie bardzo szybko się dowiem;), ale można skorzystać z "konkurencyjnego" forum miłośników statystyki (jest tam spore grono doświadczonych użytkowników R). Można też próbować na odpowiedniku forum o R na LinkedIn. Z tego co pamiętam było (jest?) forum tylko i wyłącznie o R, ale ostatnio kiedy tam byłem nie było zbyt aktywne.

Pozdrawiam serdecznie:)Marek Kolano edytował(a) ten post dnia 28.02.10 o godzinie 21:39

Temat: Programowanie w R

Marek Kolano:
Posiadam. Również polecam. Nie uważam natomiast, że przeznaczona jest dla bardziej zaawansowanych statystyków. Fakt - nie wprowadza podstawowych pojęć, wzorów itp. ale zakładam że autor pierwszego posta ma za sobą jakąś formę podstawowego kuru statystyki.

Z jednej strony ma Pan rację - wystarczy rozumieć, do czego jest dana metoda, odpalić R oraz korzystać z przykładów w książce. Ale do tego wystarczyłaby 1/10 tej książki - po prostu strony z przykładami. W książce zawarto jednak nie tylko przykłady wywołania metod, ale także ich matematyczny opis. A ten miejscami nie jest prosty: ACE, AVAS, MART,SVM, analiza dyskryminacyjna, analiza czynnikowa czy niemetryczne skalowanie wielowymiarowe. Nie są raczej zagadnienia z podstawowego kursu. Innymi słowy - będą tam wzory, niektóre złożone. A opis wymagać będzie od czytelnika pewnego obycia z algebrą i analizą. Weźmy taką PCA, gdzie, czytając, warto "zakumać", że jest to ortogonalne, liniowe przekształcenie przestrzeni danych. A te słowa niosą ze sobą wiele treści. Wiążą się z nimi pojęcia takie, jak wartość własna (i osobliwa), wektor własny, ortogonalizacja bazy - macierzy kowariancji (i przyda się rozkład SVD albo QR), gdzie łącza się pojęcia wartości własnej i wariancji wyjaśnionej. To trzeba "czuć", bo dopiero wtedy wyjaśni się, co ta metoda robi. Stąd, z kolei, wynika świadomość założeń i ograniczeń metody, np. liniowa zależność między danymi, czy rozkład normalny danych. To jak w KMRL, gdzie uczeń, rozwiązując jej równanie macierzowe widzi, że jak gramian X będzie zerowy, to nie obliczy macierzy odwrotnej. I pewnie ucieszy się, gdy mu się pokaże GLM z uogólnieniem odwrotności macierzy (i znów SVD...) albo PCA :)

Pozdrawiam :)Adrian Olszewski edytował(a) ten post dnia 01.03.10 o godzinie 00:01
Marek K.

Marek K. Spec. ds. Analiz
Finansowo-Handlowych

Temat: Programowanie w R

Adrian Olszewski:
całość

Ma Pan rację. Nie chodziło mi o to, że korzystanie z przeróżnych metod nie powinno być poprzedzone znajomością zagadnienia i świadomością co dana procedura "robi w środku" zanim pokaże wynik. W przeciwnym wypadku nie trudno o gruby metodologiczny błąd "trzeciego rodzaju";)

Chodziło mi o to, że nie jest to moim zdaniem pozycja, po sięgnięciu do której, osoba po podstawowym kursie statystyki złapie się za głowę i stwierdzi że nie rozumie z tego absolutnie nic. Fakt umieszczenia przykładów po być może nie zawsze zrozumiałym wstępie teoretycznym moim zdaniem sprawia, że dana procedura jest nieco jaśniejsza, a i zachęca do zgłębiania literatury jeśli któraś z opisanych procedur szczególnie zainteresuje czytelnika.

Również pozdrawiam:)

Temat: Programowanie w R

Marek Kolano:
Fakt umieszczenia przykładów po być może nie zawsze zrozumiałym wstępie teoretycznym moim zdaniem sprawia, że dana procedura jest nieco jaśniejsza

Tak, te przykłady ratują sytuację.

Pamiętam moje pierwsze wrażenia z dorwania tej książki - "o k*a, a więc to o to im chodziło? Hmm..." :) A to dlatego, że po czysto akademickim (czytaj - miejscami skomplikowanym matematycznie) wstępie z kupą obliczeń - nagle przejście do zupełnie prostego zastosowania, taki przeskok. Oczywiście "skomplikowane" było w moim odczuciu, dla kogoś to może być przystępnie i prosto opisane, a zagadnienia oczywiste, jak dzisiaj dla mnie PCA. Przyda się też umiejętność odczytywania zapisów macierzowych, jak przy analizie dyskryminacji (r. 7).

W niektóre wzory (część z tych, co podałem wyżej) "nie mam serca" się wgryźć, a odpowiadające im metody traktuję z dusza na ramieniu, po prostu jako czarne skrzynki - "nie mam zielonego pojęcia, co tam się liczy i po co, grunt, że wypluwa wynik, o który mi chodziło".

Anyaway, książka należy do obowiązkowych :) Jak zresztą wszystko prof. Gatnara!

Aaaa, co do nauki R, to polecam Autorowi wątku zainstalować sobie RCommandera i podejrzeć generowane przez niego polecenia. To też fajna nauka, od razu widać efekt działania poprawnie zbudowanych poleceń, w dodatku można je sobie skopiować i eksperymentować na nich.
Marek K.

Marek K. Spec. ds. Analiz
Finansowo-Handlowych

Temat: Programowanie w R

Adrian Olszewski:
Pamiętam moje pierwsze wrażenia z dorwania tej książki - "o k*a, a więc to o to im chodziło? Hmm..." :)

Hahaha, moje odczucia są identyczne!:D Czytam czytam, mniej więcej rozumiem. Więcej na początku, mniej bliżej końca. Jednak jak już zobaczę wynik w postaci interpretacji słownej czy wykresu to się przyjemnie wraca do tej teorii. Często mam też tak, że muszę jakieś zagadnienie odłożyć żeby doznać za jakiś czas olśnienia, które pozwala mi wrócić i zrozumieć jakiś szczegół. Ale może to dlatego że mam słabe podstawy matematyczne i mózg się musi oswoić;) Pan na informatyce miał z matematyką dużo więcej do czynienia niż ja na psychologii:)
Aaaa, co do nauki R, to polecam Autorowi wątku zainstalować sobie RCommandera i podejrzeć generowane przez niego polecenia.

Z tego co wiem, to w tej sprawie są 2 szkoły. Jedni mówią, że warto na początku korzystać z trybu nadzorowanego, zwłaszcza jak ktoś się przesiada z pakietu z GUI z prawdziwego zdarzenia lub ogólnie nie jest zaznajomiony z komputerami i konsola go przeraża. Inni zaś radzą na początku powoli poznawać R korzystając jedynie z konsoli, co według nich pozwala na swobodniejszą pracę w miarę przechodzenia do używania metod których nie ma "pod przyciskiem".Marek Kolano edytował(a) ten post dnia 01.03.10 o godzinie 01:52
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Programowanie w R

Programowanie w R? Raczej chodziło o analizę danych w R. Jeżeli ktoś przez programowanie rozumie pisanie nowych algorytmów numerycznych, to R nie jest najlepszym wyborem. Prawie wszystkie takie algorytmy dostępne w R są napisane w języku C, fortran lub innym.
Domyślnym interfejsem do programu R jest linia komend ale to nie oznacza, że każda osoba korzystająca z tego programu jest na tą formę interakcji skazana.
Dlaczego warto zainwestować w naukę tej formy interakcji z pakietem:
1. napisane i zapisane komendy są świetną dokumentacją przeprowadzonej analizy,
2. wykorzystanie pełni możliwości pakietów i funkcji (nie wszystkie są dostępne z poziomu GUI).
Jeżeli ktoś ma zamiar przeprowadzić kilka analiz a potem o tym zapomnieć, to inwestowanie czasu w naukę komend jest stratą czasu.

Temat: Programowanie w R

Marek Kolano:
Ma Pan rację. Nie chodziło mi o to, że korzystanie z przeróżnych metod nie powinno być poprzedzone znajomością zagadnienia i świadomością co dana procedura "robi w środku" zanim pokaże wynik.

Ano... Oto przykład brutalnego życia: http://www.statystycy.pl/p8414_%5Br%5D_robust_pca.php?... :]
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Programowanie w R

Z tym wnikaniem do środka jest wieczny problem, bo na którym etapie zakończyć.
1. Etap poznanie założeń (w tym ograniczeń) metody oraz interpretację wyników,
2. Etap badać implementację numeryczną algorytmu,
3. Etap zbadać wpływ użytego procesora, kompilatora na obliczenia.

Pierwszy etap jest bezsprzeczny, pozostałe zależą od czasu oraz umiejętności.
Działanie algorytmów można porównać stosując kilka programów do wykonania tych samych obliczeń.
Instytucją która bada etap 2 jest NIST. Można ściągnąć przykładowe zbiory danych i wyniki porównać z tymi wzorcowymi.
Niestety dane są przgotowane tylko do testowania niektórych modeli.

Temat: Programowanie w R

Przy okazji - znalazłem na Allegro nową (no, nie taką nową, bo z 2009r.) pozycję dotyczącą R. A nuż się komuś przyda. Tej literatury nigdy dość :)

Statystyczne systemy uczące się.
Ćwiczenia w oparciu o pakiet R.
- Jan Ćwik, Jan Mielniczuk

Książka jest zbiorem ćwiczeń wraz z rozwiązaniami i dyskusją, dotyczących statystycznej analizy danych wielowymiarowych z perspektywy eksploatacji (ang. data mining). Problemy dotyczą min. analizy składowych głównych, metod klasyfikacji i analizy skupień oraz szacowania funkcji regresji. Cykle tematyczne poprzedzone są krótkim wstępem. Książka jest przeznaczona do wykorzystania w trakcie jednosemestralnych ćwiczeń laboratoryjnych
z zaawansowanej algebry danych.

SPIS TREŚCI:

Przedmowa 7

1. Analiza składowych głównych 9
1.1. Przykładowa analiza 10
1.2. Regresja składowych głównych (PCR) i regresja
częściowych najmniejszych kwadratów (PLSR) 17
1.3. Zadania 22

2. LDA i QDA 25
2.1. Dwie klasy, dwie zmienne 29
2.2. Trzy klasy, dwie zmienne 36
2.3. Trzy klasy, trzy zmienne 42
2.4. Wiele klas, wiele zmiennych 44
2.5. Zadania 46

3. Dyskryminacja logistyczna 51
3.1. Zadania 60

4. Ocena jakości klasyfikatorów. Krzywa ROC i parametr AUC 63
4.1. Ocena jakości reguły klasyfikacyjnej 63
4.2. Metody estymacji prawdopodobieństwa błędnej klasyfikacji 64
4.2.1. Kroswalidacja n-krotna (leave-one-out, one-leaving-out) 64
4.2.2. Kroswalidacja 10-krotna 66
4.2.3. Metoda oceny błędu na podstawie wielokrotnego podziału próby 68
4.3. Krzywe ROC 69
4.3.1. Binormalna krzywa ROC 72

5. Estymacja gęstości 77
5.1. Wprowadzenie 77
5.2. Estymacja gęstości jednowymiarowej 79
5.3. Klasyfikacja na podstawie gęstości jednowymiarowej 83
5.4. Estymacja gęstości dwuwymiarowej 84
5.5. Klasyfikacja na podstawie gęstości dwuwymiarowej 85
5.6. Metoda typu „najbliższy sąsiad” (kNN) 88
5.7. Zadania 90

6. Drzewa klasyfikacyjne i regresyjne 93
6.1. Drzewa regresyjne 93
6.2. Drzewa klasyfikacyjne 94
6.3. Drzewa regresyjne: dane fitness 95
6.4. Drzewa klasyfikacyjne: dane Cars93 105
6.5. Redukcja zmiennych w przypadku drzew klasyfikacyjnych 110
6.6. Zadania 114

7. Metody nieparametrycznej estymacji funkcji regresji 117
7.1. Nieliniowe parametryczne metody regresyjne 117
7.2. Nieparametryczne metody regresyjne 118
7.2.1. Metody nieparametryczne - niski wymiar wektora atrybutów 118
7.2.2. Metody nieparametryczne - wysoki wymiar wektora atrybutów 124
7.3. Zadania 132

8. Metody łączenia klasyfikatorów: bagging, boosting i lasy losowe 137
8.1. Klasyfikator AdaBoost dla drzewa 140
8.2. Klasyfikator AdaBoost dla LDA 142
8.3. Zadania 147

9. Analiza skupień i skalowanie wielowymiarowe 149
9.1. Zadania 156

10. Przykład analizy: dane Image Segmentation 159
10.1. Wczytanie danych i wybranie atrybutów 159
10.2. PCA 162
10.3. LDA 166
10.4. QDA 167
10.5. Drzewa klasyfikacyjne 169
10.5.1. LDA z pominięciem kilku klas 175
10.6. kNN 175
10.7. Klasyfikacja na podstawie składowych głównych 179

11. Dodatek 183
11.1. Używane zbiory danych 183


-------------------------------------------------
I jeszcze jedna.

Podstawy statystyki z przykładami w R - Tomasz Górecki

Ze spisu treści wynika, że to jest kolejny z pierdyliarda podręczników podstaw statystyki. Ale - od przybytku głowa nie boli :]Adrian Olszewski edytował(a) ten post dnia 09.04.11 o godzinie 23:27
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Programowanie w R

Mniej statystyczne spojrzenie na R:

http://heather.cs.ucdavis.edu/~matloff/R/RProg.pdf

Temat: Programowanie w R

Nowa pozycja od samego prof. Gatnara :)

Analiza danych jakościowych i symbolicznych z wykorzystaniem programu R

Spis treści:
Wstęp
Rozdział 1. Wprowadzenie do analizy danych jakościowych i symbolicznych
1.1.Macierz danych i tablica danych
1.2.Miary odległości
1.2.1.Dane porządkowe
1.2.2.Dane symboliczne
1.3.Dyskretyzacja zmiennych ilościowych
1.4.Wybrane rozkłady prawdopodobieństwa zmiennych dyskretnych
1.5.Wizualizacja danych
Rozdział 2. Analiza korespondencji
2.1.Wprowadzenie
2.2.Tablice kontyngencji
2.3.Analiza zależności między zmiennymi
2.4.Analiza korespondencji dwu i wielu zmiennych
2.5.Wizualizacja wyników klasycznej i wielowymiarowej analizy korespondencji
2.6.Zastosowania z wykorzystaniem programu R
Rozdział 3. Modele logarytmiczno-liniowe
3.1.Wprowadzenie
3.2.Klasyczny model logarytmiczno-liniowy
3.3.Hierarchiczne modele logarytmiczno-liniowe
3.4.Miary dopasowania modeli logarytmiczno-liniowych
3.5.Zastosowania z wykorzystaniem programu R
Rozdział 4. Modelowanie i prognozowanie zmiennych dwumianowych
4.1.Wprowadzenie
4.2.Liniowy model prawdopodobieństwa (LMP)
4.3.Modele logitowe i probitowe
4.4.Prognozy na podstawie modeli dwumianowych
4.5.Zastosowania z wykorzystaniem programu R
Rozdział 5. Modelowanie zmiennych wielomianowych
5.1.Wprowadzenie
5.2.Wielomianowy model logitowy
5.3.Warunkowy model logitowy
5.4.Analiza historii zdarzeń
5.5.Zastosowania z wykorzystaniem programu R
Rozdział 6. Analiza wariancji
6.1.Podstawy teoretyczne
6.1.1.Jednoczynnikowa analiza wariancji
6.1.2.Dwuczynnikowa analiza wariancji
6.1.3.Założenia analizy wariancji
6.1.4.Testy post hoc
6.2.Podstawowe schematy badań
6.3.Zastosowania z wykorzystaniem programu R
Rozdział 7. Analiza skupień i porządkowanie liniowe na podstawie danych
porządkowych
7.1.Wprowadzenie
7.2.Analiza skupień na podstawie danych porządkowych
7.3.Porządkowanie liniowe na podstawie danych porządkowych
7.4.Zastosowania z wykorzystaniem programu R
Rozdział 8. Drzewa klasyfikacyjne i regresyjne dla jakościowych zmiennych
objaśniających
8.1.Podstawy teoretyczne
8.2.Drzewa klasyfikacyjne i regresyjne
8.3.Dobór jakościowych zmiennych objaśniających
8.4.Określenie optymalnej postaci modelu
8.5.Zastosowania z wykorzystaniem programu R
Rozdział 9. Modele klas ukrytych dla danych jakościowych
9.1.Wprowadzenie
9.2.Model klas ukrytych dla zmiennych binarnych i wielomianowych
9.3.Model regresji klas ukrytych
9.4.Zastosowania z wykorzystaniem programu R
Rozdział 10. Modele mieszanek dla danych jakościowych
10.1.Wprowadzenie
10.2.Model GLM
10.3.Modele mieszanek - podstawy teoretyczne
10.4.Modele mieszanek rozkładów dwumianowych
10.5.Modele mieszanek rozkładów Poissona
10.6.Zastosowania z wykorzystaniem programu R
Rozdział 11. Skalowanie wielowymiarowe na podstawie danych jakościowych
i symbolicznych
11.1.Procedury skalowania wielowymiarowego na podstawie danych jakościowych
11.2.Analiza iinfolding
11.3.Skalowanie wielowymiarowe na podstawie danych symbolicznych
11.4.Zastosowania z wykorzystaniem programu R
Rozdział 12. Analiza skupień na podstawie danych symbolicznych
12.1.Wprowadzenie
12.2.Podejścia i metody klasyfikacji danych symbolicznych
12.3.Procedura klasyfikacji danych symbolicznych
12.4.Zastosowania z wykorzystaniem programu R
Rozdział 13. Analiza dyskryminacyjna i drzewa klasyfikacyjne na podstawie
danych symbolicznych
13.1.Analiza dyskryminacyjna bazująca na estymatorach intensywności
13.2.Drzewa klasyfikacyjne bazujące na optymalnym podziale
13.3.Bayesowskie drzewa klasyfikacyjne
13.4.Zastosowania z wykorzystaniem programu R
Dodatek A. Format danych symbolicznych
Bibliografia
Indeks
Bogdan Taranta

Bogdan Taranta Business Solutions
Manager

Temat: Programowanie w R

O! Już zamawiam - książki prof. Gatnara można polecać w ciemno.
Mały update - w EMPiK'u dostępna w postaci e-booka.Bogdan Taranta edytował(a) ten post dnia 19.10.11 o godzinie 09:05
Kamil Bęczyński

Kamil Bęczyński R, SAS, analizy

Temat: Programowanie w R

Bogdan Taranta:
O! Już zamawiam - książki prof. Gatnara można polecać w ciemno.
Mały update - w EMPiK'u dostępna w postaci e-booka.

o która książkę chodzi ?

ps. wszystko prof. Ćwika ze statystyki jest dobre, z wyjątkiem rozdziałów traktujących o regresji, jak dla mnie

Temat: Programowanie w R

Tę ostatnią.

Swoją drogą szkoda, że nie powstają u nas dzieła klasy tych z wydawnictw Springer Verlag, Pearson PH, Chapmann&Hall czy Wiley (kilka tuzinów znanych nazwisk) :/ Przepaść między ich 'akademickim podręcznikiem' a naszym jest spora, zaś 'podręczników researchera' czy 'handbooków' w języku polskim praktycznie nie ma. Tłumaczeń także nie ma zbyt wiele (Brandt, Larose, Hand). Sytuację ratują wielcy polskiej areny prof. Gatnar, Koronacki, Ćwik, Krzyśko czy Stanisz. Choć czasem IMHO nie wykorzystują potencjału drzemiącego w danej dziedzinie i zdarza się, że ich książki nie wychodzą poza formę i zakres skryptu dla studentów, np. 'Systemy uczące się' (Koronacki, Ćwik); dopiero dwie inne pozycje o tym samym tytule (jedna Krzyśki, Wołyńskiego, Góreckiego, Skorzybuta i druga, o innym profilu, Cichosza) podnoszą poprzeczkę.

U nas często książka sprawia wrażenie 'najeżonej wiedzą tajemną i wzorami', ale... przejścia między nimi są na zasadzie 'dowodzi się/obliczono/można wykazać, że' i to, co akurat najciekawsze - jest pominięte. W zachodnich pozycjach, przynajmniej tych czołowych, bardzo często wszystko jest dokładnie wyłuszczone (np. "Design and analysis" Keppela, "Handbook" Sheskina) a do tego jest mnóstwo dyskusji i praktycznych wskazówek. Albo z kolei prawie w ogóle nie ma wzorów, a książka, choć miejscami jest 'hasłowa', to nadal jest konkretna i zawiera dużo know-how (np. cykl poświęcony DM Larose'a, "Making sense of data" czy "Statystyka medyczna w zarysie"). W Polsce tę drugą, 'praktyczną' metodę przyjął, ze świetnym rezultatem, prof. Stanisz.Adrian Olszewski edytował(a) ten post dnia 20.10.11 o godzinie 01:46

Temat: Programowanie w R

Analiza danych z programem R. Modele liniowe z efektami stałymi, losowymi i mieszanymi autorstwa niezmordowanego w swych wydawniczych wysiłkach Przemysława Bięcka (dziekujemy!) :)

RSS: http://allegro.pl/rss.php?feed=search&string=analiza+d...


Obrazek
Adrian Olszewski edytował(a) ten post dnia 06.02.12 o godzinie 16:10
Kamil Bęczyński

Kamil Bęczyński R, SAS, analizy

Temat: Programowanie w R

"Art of R Programming"

http://www.amazon.com/Art-Programming-Statistical-Soft...

ja dodam tę pozycję, potem znajdę i wkleję link do ciekawej recenzji

ps. książka jako jedna z niewielu traktuje o programowaniu równoległym w R (
Chapter 16: Parallel R) było nawet coś o CUDAchKamil B edytował(a) ten post dnia 06.02.12 o godzinie 16:44
Maciej B.

Maciej B. Doktorant

Temat: Programowanie w R

R Inferno - http://www.burns-stat.com/pages/Tutor/R_inferno.pdf

Całkiem fajna pozycja o problemach, które napotkamy podczas zabawy z R :)
PDF darmowy, wersja drukowana do kupienia : http://www.lulu.com/product/paperback/the-r-inferno/18...
Kamil Bęczyński

Kamil Bęczyński R, SAS, analizy

Temat: Programowanie w R

Maciej B.:
R Inferno - http://www.burns-stat.com/pages/Tutor/R_inferno.pdf

Całkiem fajna pozycja o problemach, które napotkamy podczas zabawy z R :)
PDF darmowy, wersja drukowana do kupienia : http://www.lulu.com/product/paperback/the-r-inferno/18...

inferno jest dobre, osobiście uwielbiam stosować, składnię w stylu do budowania obiektów :

vec <- numeric(0)
for(i in 1:n) vec <- c(vec, i)

(oczywiście do trudniejszych zadań jak zbieranie wyników z iteracji pętli while() ) , spodziewałem się, że jest nieefektywna (bo rzadko ją widzę u innych), ale nie pomyślałem, żeby przetestować czas działania tak jak to zrobiono na stronie 12 :)

dobre, strona 25 :
"A common refex is to use a function in the apply family. This is not vectorization,
it is loop-hiding. The apply function has a for loop in its de nition.
The lapply function buries the loop, but execution times tend to be roughly
equal to an explicit for loop.
(...)"

"When some people rst get to R,
they spend a lot of time trying to get rid of NAs. People probably did the same
sort of thing when zero was first invented."

:DKamil B edytował(a) ten post dnia 07.02.12 o godzinie 00:06

Następna dyskusja:

Programowanie w R - nowa ks...




Wyślij zaproszenie do