Odpowiedz Odpowiedz

Drzewa klasyfikacyjne, lasy losowe

Temat: Drzewa klasyfikacyjne, lasy losowe

Witam, w tej chwili zacząłem poznawać narzędzie jakim są lasy losowe, podziały w węzłach przeprowadza się stosując bardzo proste reguły liniowe. Zatem zastanawiam się czy warto jest dodać do zbioru danych zmienne przekształcone nieliniowo na przykład interakcje pomiędzy zmiennymi : gdy x,y, to zmienne to do zbioru danych można dodać zmienną z=x*y. Czy stosowaliście takie podejście lub o nim czytaliście ? Jakim innym ciekawym transformacjom można poddać dane oraz jak wybrać zmienne którym je poddać ? Wiem, że taka procedura jest kosztowna obliczeniowo, ale w końcu można ją przeprowadzić tylko dla najbardziej istotnych zmiennych.

Mam jeszcze pytanie ogólne : jaki sposób można wykryć zmienne, które badane łącznie niosą więcej informacji, niż te same zmienne badane osobno ? Czyli (BladModelu|x,y,xy)<(BladModelu|x,y), gdzie xy to jakaś funkcja łącząca x i y, jeszcze konkretniej : czy do tego celu da się użyć jakichś miar stosując je do łącznej gęstości p(x,y) ? Gdy x i y są niezależne, to różnic pomiędzy lewą i prawą stroną nierówności (BladModelu|x,y,xy)<(BladModelu|x,y) będzie mała.

Link do wypowiedzi

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Drzewa klasyfikacyjne, lasy losowe

Kamil Bęczyński:
Mam jeszcze pytanie ogólne : jaki sposób można wykryć zmienne, które badane łącznie niosą więcej informacji, niż te same zmienne badane osobno ? Czyli (BladModelu|x,y,xy)<(BladModelu|x,y), gdzie xy to jakaś

> funkcja łącząca x i y, jeszcze konkretniej : czy do tego celu

da się użyć jakichś miar stosując je do łącznej gęstości p(x,y) ? Gdy x i y są niezależne, to różnic pomiędzy lewą i prawą stroną nierówności (BladModelu|x,y,xy)<(BladModelu|x,y) będzie mała.

Nie jestem pewny o jaki model zależności ci chodzi. Czy interesuje cię łączny wpływ x,y na inną zmienną z (sugerowałby to zapis (BladModelu|x,y)) czy też o zależność pomiędzy x i y?

Link do wypowiedzi

konto usunięte

Temat: Drzewa klasyfikacyjne, lasy losowe

Kamil Bęczyński:
Witam, w tej chwili zacząłem poznawać narzędzie jakim są lasy losowe, podziały w węzłach przeprowadza się stosując bardzo proste reguły liniowe. Zatem zastanawiam się czy warto jest

Random forest wymyślił nieżyjący już Leo Breiman. Proponuję poszukać jego artykułów na google. Są naprawdę dobrze napisane. Znajdziesz w nich odpowiedź na wszystkie pytania, które zadajesz.

dodać do zbioru danych zmienne przekształcone nieliniowo na przykład interakcje pomiędzy zmiennymi : gdy x,y, to zmienne to do zbioru danych można dodać zmienną z=x*y. Czy stosowaliście takie podejście lub o nim czytaliście ? Jakim innym ciekawym transformacjom można poddać dane oraz jak wybrać zmienne którym je poddać ? Wiem, że taka procedura jest kosztowna

Artykuły Leo Breimana...

Mam jeszcze pytanie ogólne : jaki sposób można wykryć zmienne, które badane łącznie niosą więcej informacji, niż te same zmienne badane osobno ? Czyli

Artykuły Leo Breimana...

Do lasów losowych są dobre pakiety w R. Stosowałem je w ramach jednego z konkursów, w którym uczestniczyłem hobbystycznie. Z dobrymi skutkami.

Link do wypowiedzi

« Wróć do tematów

Odpowiedz

Podobne tematy

Następna dyskusja:

Statystyka i jej okolice ;-)

Czy na pewno chcesz zrezygnować z tej grupy?

Zgłoś nieprawidłowości w wypowiedzi

Drzewa klasyfikacyjne, lasy losowe

Drzewa klasyfikacyjne, lasy losowe

Blokowanie użytkownika

Temat: Drzewa klasyfikacyjne, lasy losowe

Temat: Drzewa klasyfikacyjne, lasy losowe

Temat: Drzewa klasyfikacyjne, lasy losowe

Podobne tematy

Kursy i szkolenia przez... » Kurs Machine Learning - drzewa decyzyjne i lasy losowe -

Marketing Bezpośredni » UŚUDE - czyli mozna wycinać lasy aby zapychać skrzynki... -

Greenpeace » Ratuj lasy amazonki -

Związek Stowarzyszeń Polska... » Nie tylko lasy giną... -

Sami ale nie samotni » Nie tylko lasy giną... -

Inwestycje w Nieruchomości » Nieruchomości, grunty ,lasy Wspólnoty Wiejskiej -

Fitness & Kulturystyka » Nordic Walking Gdynia, Sopot - plaże, lasy -

FITNESS » Nordic Walking - plaże i lasy: Gdynia i Sopot -

Narty biegowe i śladowe » wypożyczalnia w parku powsińskim (lasy kabackie) -

Narty biegowe i śladowe » Narty na podwarszawskie lasy -

Kurs Machine Learning - drz...

Testowanie hipotez - rozkład...

Prognozowanie

Oferty pracy

Statystyka i jej okolice ;-)

Czy na pewno chcesz zrezygnować z tej grupy?

Zgłoś nieprawidłowości w wypowiedzi

Drzewa klasyfikacyjne, lasy losowe

Drzewa klasyfikacyjne, lasy losowe

Blokowanie użytkownika

Temat: Drzewa klasyfikacyjne, lasy losowe

Temat: Drzewa klasyfikacyjne, lasy losowe

Temat: Drzewa klasyfikacyjne, lasy losowe

Podobne tematy

Kursy i szkolenia przez... » Kurs Machine Learning - drzewa decyzyjne i lasy losowe -

Marketing Bezpośredni » UŚUDE - czyli mozna wycinać lasy aby zapychać skrzynki... -

Greenpeace » Ratuj lasy amazonki -

Związek Stowarzyszeń Polska... » Nie tylko lasy giną... -

Sami ale nie samotni » Nie tylko lasy giną... -

Inwestycje w Nieruchomości » Nieruchomości, grunty ,lasy Wspólnoty Wiejskiej -

Fitness & Kulturystyka » Nordic Walking Gdynia, Sopot - plaże, lasy -

***FITNESS*** » Nordic Walking - plaże i lasy: Gdynia i Sopot -

Narty biegowe i śladowe » wypożyczalnia w parku powsińskim (lasy kabackie) -

Narty biegowe i śladowe » Narty na podwarszawskie lasy -

Kurs Machine Learning - drz...

Testowanie hipotez - rozkład...

Prognozowanie

Oferty pracy

FITNESS » Nordic Walking - plaże i lasy: Gdynia i Sopot -