Sylwester S.

Sylwester S. Business Data
Analyst

Temat: Testowanie hipotez - rozkład dwumianowy - excel

Witam.
Mam problem z jednym zadaniem z tematyki testowania hipotez. Zadanie wygląda następująco:
W dużym przedsiębiorstwie analizowano wydajność pracy. Wybrano losowo 200
pracowników wykonujących te same wyroby. Rozkład liczebności wyrobów:
liczba wyrobów: liczba pracowników:
2 4
3 36
4 56
5 44
6 32
7 16
8 12
Przyjmując poziom istotności 0,05 sprawdzić czy rozkład wyrobów
wykonywanych przez
pracowników w ciągu godziny jest zbliżony do rozkładu dwumianowego.

Zadanie będzie rozwiązane przy użyciu excela. I teraz mój pomysł na to zadanie to wykorzystać test Chi^2. (policzyć liczebności w próbach (n_i), prawdopodobieństwa (p_i) i wyliczyć statystykę ze wzoru Suma[(n_i-n*p_i)^2/n*p_i] ). Następnie wyznaczyć przedział odrzucenia przy użyciu funkcji rozkład.chi.odw(0,05;liczba stopni swobody) i sprawdzić czy policzona wcześniej statystyka "wpada" do tego przedziału.
I teraz mam 2 pytania:
1. Jak dla tych danych policzyć wartości n_i, p_i ?
2. Ile będzie stopni swobody?
Czy w ogóle dobrze kombinuje z rozwiązaniem tego zadania? Wszelkie poprawki mile widziane :) Pozdrawiam
Grzegorz Melniczak

Grzegorz Melniczak Have you tried
turning it off and
on again?

Temat: Testowanie hipotez - rozkład dwumianowy - excel

Żeby wogóle ruszyć musisz znać parametry rozkładu przeciw któremu chcesz testować hipotezę - w twoim przypadku jest to Binom(m,p) czyli potrzebujesz "m" i "p".

m - liczba możliwych "ilości wyrobów"
p - prawdopodobieństwo "sukcesu"

Test chi2 jest dobrym pomysłem.

n_i masz dane - jest to liczba pracowników przypadająca na daną liczbę wyrobów i
p_i = Binom(m,i)*(p^i)*((1-p)^(n-i))

ilość stopni swobody = m

Ewentualnie możesz "p" estymować znając "m" i korzystając z tego, że wartość oczekiwana rozkładu dwumianowego jest równa "m*p" a jej estymatorem jest średnia - w takim przypadku zmniejszy Ci się liczba stopni swobody o jeden.
Sylwester S.

Sylwester S. Business Data
Analyst

Temat: Testowanie hipotez - rozkład dwumianowy - excel

Grzegorz Melniczak:
p_i = Binom(m,i)*(p^i)*((1-p)^(n-i))


No właśnie. A jak teraz wrzucić to do excela, żeby mi to p_i wyliczył? Jest funkcja ROZKŁAD.DWUM(liczba_s;liczba_prób;prawdopodobieństwo_s;łączny) i to pewnie z niej mam skorzystać. Tylko nie wiem jakie parametry tam wpisać.

Nie rozumiem za bardzo ile wynosi m w kontekście naszego zadania. Czy m=8?

Mam podobne zadanie rozwiązane, tylko z rozkładem Poissona. I tam nieznaną wartość lambda estymujemy przez średnią, później do wbudowanej funcji jest wyraźnie napisane, że jednym z argumentów jest średnia, a w tym dwumianowym to nie wiem za bardzo na czym polega ten nasz "sukces" :)Sylwester Sadowski edytował(a) ten post dnia 04.01.11 o godzinie 16:55
Grzegorz Melniczak

Grzegorz Melniczak Have you tried
turning it off and
on again?

Temat: Testowanie hipotez - rozkład dwumianowy - excel

Sylwester Sadowski:
Grzegorz Melniczak:
p_i = Binom(m,i)*(p^i)*((1-p)^(n-i))


No właśnie. A jak teraz wrzucić to do excela, żeby mi to p_i wyliczył? Jest funkcja ROZKŁAD.DWUM(liczba_s;liczba_prób;prawdopodobieństwo_s;łączny) i to pewnie z niej mam skorzystać. Tylko nie wiem jakie parametry tam wpisać.

Jeżeli X ~Binom(m,p) wtedy:
P(X=k)=ROZKŁAD.DWUM(k;m;p;FAŁSZ)
P(X<=k)=ROZKŁAD.DWUM(k;m;p;PRAWDA)
dla k in {0,...,m}

> Nie rozumiem za bardzo ile wynosi m w kontekście naszego zadania.
Czy m=8?

W tym właśnie sęk, że ta wartość nie jest podana. Możesz założyć pewną wartość m ale powinny być jakieś przesłanki skąd ta wartość się wzięła.
Arbitralny wybór m pozwala na manipulację wynikiem testu - biorąc dostatecznie duże m zawsze odrzucisz hipotezę zerową.
Mam podobne zadanie rozwiązane, tylko z rozkładem Poissona. I tam nieznaną wartość lambda estymujemy przez średnią, później do wbudowanej funcji jest wyraźnie napisane, że jednym z argumentów jest średnia, a w tym dwumianowym to nie wiem za bardzo na czym polega ten nasz "sukces" :)Sylwester Sadowski edytował(a) ten post dnia 04.01.11 o godzinie 16:55

"Sukces" jest dość nietypowy w interpretacji. Jeżeli założymy, że pracownik może wyprodukować pewną liczbę produktów M w ciągu godziny to sukcesem jest wytworzenie produktu natomiast porażką jest niewytworzenie produktu, zatem pracownik może maksymalnie zaliczyć od 0 do M "sukcesów".
Marek Żelazny

Marek Żelazny Dyrektor handlowy,
Baterpol S.A.

Temat: Testowanie hipotez - rozkład dwumianowy - excel

Myślę, że w przypadku tego zadania, nie należy parametrom rozkładu dwumianowego nadawać interpretacji wynikającej ze schematu Bernoulliego. Traktuj je po prostu jak parametry rozkładu (oczywiście jeśli zadanie nadal Cię interesuje :)), które można estymować np. metodą momentów.
Sylwester S.

Sylwester S. Business Data
Analyst

Temat: Testowanie hipotez - rozkład dwumianowy - excel

Zadanie dawno rozwiązane, sesja zaliczona a ja jakoś tak zapomniałem podziękować :) Ale przeglądając tematy na szczęście mi się przypomniało :) Zatem dziękuję Panie Grzegorzu i Panie Marku za pomoc. A może wyjaśnię w czym był główny problem, a nóż się komuś przyda. Otóż przy liczeniu prawdopodobieństw empirycznych należało skorzystać z funkcji excela rozkład.dwum gdzie jednym z parametrów jest prawdopodobieństwo sukcesu. A jest to średnia liczba wyrobów przypadająca na jednego pracownika/maksymalna liczba wyrobów ( w tym wypadku 8). Niby proste i oczywiste jak już się widzi rozwiązanie, ale jakoś nie mogłem na to wpaść :) Pozdrawiam

Następna dyskusja:

Testowanie założenia IID




Wyślij zaproszenie do