Temat: Analiza dyskryminacyjna

Witam,
chcialabym przeprowadzić analizę dyskryminacyjną w programie R.
Ale dokońca nie wiem co tu jest źle.

Dane mam z 380 powiatów i 5 zmiennych

DANE<-data.frame(dane, etykieta=rep(c("APT","BEZ","WYP","WYN","SZK"),rep(380,5))) #w zasadzie nie wiem po co mam tworzyć tą etykietę

train<-sample(1:1900,76)
table(DANE$etykieta[train])
z<-lda(etykieta~.,DANE,prior=c(1,1,1,1,1)/5, subset=train) # tutaj wyskakuje błąd "Error in lda.default(x, grouping, ...) : 'prior' is of incorrect length"

predict(z, DANE[-train,]$class
predict(z, c(0,6))$class # i znowu błąd "Error: unexpected symbol in:
"predict(z, DANE[-train,]$class predict"

Test1<-dane
Test2<-DANE

predict(z, data.frame(Test1))$class
predict(z, data.frame(Test2))$class

Jaka długość powinien mieć wektor "prior"?
Gdzie jest błąd w składni w wyrażeniu "predict(z, DANE[-train,]$class"?
Czy test 2 ma być na danych z "etykietami"? Po co w ogóle taka czynność się robi?

Będę wdzięczna za pomoc:)
pozdrawiam
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Analiza dyskryminacyjna

Jeżeli nie wiesz po co jest etykieta w twoim zbiorze to nie rozumiesz co chcesz zrobić. Jeżeli jest to prawdą to trudno będzie ci pomóc.
Teoretycznie wszystko jest OK. Jeki jest wynik tej komendy: table(DANE$etykieta[train]).

Następna dyskusja:

Analiza dyskryminacyjna - l...




Wyślij zaproszenie do