konto usunięte
Temat: podział obserwacji zachowujący stratyfikację
Witam wszystkich,chciałbym się dowiedzieć jak podzielić zbiór danych na zbiór uczący (zawierający 75% wszystkich obserwacji) oraz zbiór testowy (zawierający pozostałych 25% obserwacji) tak aby nowo powstałe zbiory zachowały początkową stratyfikację utrzymującą proporcję 70% obserwacji należących do klasy A i 30% obserwacji należących do klasy B.
Z pierwszą częścią zadania potrafię sobie poradzić
n.obs<-nrow(data)
test<-sample(1:n.obs, round(n.obs/4), replace=F)
learn.set<-data[-test,]
test.set<-data[test,]
nie wiem jednak jak zachować stratyfikację.