Piotr J.

Piotr J. Młodszy analityk

Temat: Co jest prawdopodobne w przedziale ufności?

Cześć wszystkim.

Mam takie pytanie. Załóżmy że mamy przedział ufności np. dla 1-a=0.95 dla średniej. Dlaczego jak napisałęm, że to jest prawdopodobieństwo, że średnia populacji znajduje się w nim z prawdopodobieństwem 95% to dostałem 0 pkt? Kilka innych osób rozumie to podobnie i też dostało 0 pkt. Kolega powiedział że tam chodzi o inne prawdopodobieństwo ale że to trudno wytłumaczyć.

Proszę o pomoc, bo będę pisał to kolokwium niedługo znowu.

Temat: Co jest prawdopodobne w przedziale ufności?

Piotr J.:
prawdopodobieństwo, że średnia populacji znajduje się w nim z prawdopodobieństwem 95% to dostałem 0 pkt?

Bo to nie jest prawdopodobieństwo tego, co napisałeś :)
rozumie to podobnie i też dostało 0 pkt.

Bo wielu ludzi rozumie to źle. Nie dziwię się, bo to "delikatna sprawa".
ale że to trudno wytłumaczyć.

Nie jest trudno, trzeba tylko to rozumieć.
Proszę o pomoc, bo będę pisał to kolokwium niedługo znowu.

Jasne :) Spróbujmy uporządkować kilka faktów:

1. Aby mówić o prawdopodobieństwie czegoś względem czegoś, co najmniej jedna z tych rzeczy musi być zmienną losową. Albo parametr (średnia) albo przedział ufności.

2. średnia populacji (ale dotyczy to dowolnego innego parametru rozkładu) jest wartością stałą, właściwą populacji, a nie zmienną losową (!). Nie ma tam żadnego losowania. Biorąc do formuły wszystkie elementy (populacja) zawsze otrzymujesz tę samą wartość (o ile oczywiście obiekty w populacji nie zmieniły do tej pory wartości badanej cechy).

3. z kolei przedział ufności jest zmienną losową (statystyką). Dlaczego? Bo zależy od próby. Od estymatora średniej, od estymatora wariancji. Estymatory są statystykami - zależą od próby. A funkcja zmiennych losowych (przedział ufności) jest zmienną losową.

4. a zatem prawdopodobieństwo 0.95 oznacza, że podczas losowania kolejnych prób z populacji, co do której wnioskujesz, 19 razy na 20 przedziały ufności obliczone dla kolejnej wylosowanej próby będą zawierać prawdziwą wartość parametru populacji (np. średniej).

5. wszystkie wartości w obliczonym przedziale ufności są jednakowo prawdopodobne - na zadanym poziomie istotności. I nic więcej. Średnia populacji może tam być lub nie. (Ale jak wykonasz 100 losowań, to 95 obliczonych przedziałów ufności będzie zawierać tę średnią.)

To, co napisałeś, to dokładnie odwrotna sytuacja.

Ty napisałeś coś takiego: "średnia populacji jest zmienną losową, a przedział ufności jest dany raz na zawsze". Narysuj na kartce "dzwon Gaussa" i dwie równoległe pionowe linie symetrycznie względem średniej możliwie szeroko. Ten "dzwon Gaussa" to Twoja "średnia populacji", a pionowe linie to Twój "przedział ufności". Tylko..., że jak pisałem - jest dokładnie odwrotnie.

Zapamiętaj na całe życie: prawdopodobieństwo dotyczy przedziału ufności, nie parametru populacji.

konto usunięte

Temat: Co jest prawdopodobne w przedziale ufności?

Adrian Olszewski:

A tak sie już ładnie rozpisałem, kiedy popsułeś jeszcze ładniejszym :>

EDIT:
Swoją drogą czasem szokuje mnie jak ludzie mylą np. alfę z np. próbą, mówiąc - niemal cytuję, aby nie zrobić wstydu znanej autorce - że [w meta-analizie] przy p=<0,95 typowym dla nauk społecznych, normalnym jest że 5% badań mówi coś przeciwnego ...

Gdzie Rzym, gdzie Krym...Michał K. edytował(a) ten post dnia 11.05.12 o godzinie 23:39

Temat: Co jest prawdopodobne w przedziale ufności?

Na mojej stronie firmowej, która właśnie powstaje, właśnie chcę umieścić, w ramach "bazy wiedzy" sekcję o najczęstszych błędach interpretacji w statystyce. "Mniej/bardziej istotne", "brak odrzucenia H0 = jej przyjęcie", bieżący temat o interpretacji CI, "istotność kliniczna i statystyczna", "mieszanie jajek z pęcherzem w metaanalizie", "wąsy na wykresie słupkowym (95%CI, SE, SD) a stat. istotnie różnice", "próba ma rozkład normalny - próba pochodzi z rozkładu normalnego", "rozkład zmiennej vs. rozkład reszt w MNK", "test Wilcoxona jest święty" i wiele, wiele innych, zebranych przez lata kwiatków :)Adrian Olszewski edytował(a) ten post dnia 12.05.12 o godzinie 01:22

konto usunięte

Temat: Co jest prawdopodobne w przedziale ufności?

Adrian Olszewski:
próba ma rozkład normalny

To lubię :)) Próba ma rozkład? Ja naprawdę rozumiem, dlaczego ktoś nie dostrzega różnicy między konkretnym rozkładem a normalnym (jako przypadku, bo wiem, że o nim głownie się uczy), ale nie odróżniać próby od rozkładu [zmiennej]?

Nie wiem, może próbę mam jakąś nienormalną ;)Michał K. edytował(a) ten post dnia 12.05.12 o godzinie 01:49

Temat: Co jest prawdopodobne w przedziale ufności?

Często spotykany skrót myślowy zmienna-próba. Sam czasem się nim posługuję, pamiętając jednak czym jest zmienna (losowa) "Wiek", a czym jest próba 10 pacjentów, w której badam rozkład zmiennej losowej "Wiek" :)

Skoro taki StatSoft może sobie pozwolić na "rozkład w próbie" (w... dziesięciu pacjentach? to chyba ... moralny :)) to możemy i my, zwykli śmiertelnicy. Byle nie podczas szkoleń (staram się pilnować) a jeśli się zdarzy, to zawsze podkreślać, czym się różni jedno od drugiego, że to jest tylko "skrót myślowy", a nie równoważność terminów.

"Średnia z próby" (jak można uśrednić ... pacjentów?), "estymacja na podstawie próby" (estymacja na podstawie... pajentów?) i tak dalej :) Praktycznie zawsze wynika z kontekstu, którą zmienną mamy na myśli. Wiadomo, że chodzi o "średnią z wartości zmiennej Wiek elementów w próbie P" albo "estymacji dokonano na podstawie wartości zmiennej Wiek w próbie P". Brrr :)

Albo taki potworek: "próba P1 została wylosowana z populacji, w której rozkład cechy Wzrost jest asymptotycznie normalny". O ile prościej brzmi "próba P1 pochodzi z rozkładu normalnego" ;)

Tutaj jednak chodziło mi o coś innego. Mianowicie to, że oczywiście zmienna ma jakiś tam rozkład, ale to NIE O TEN rozkład chodzi podczas wyboru testu parametrycznego bądź nieparametrycznego, tylko o ten, z którego ona pochodzi. Kiedyś napisałem na ten temat coś takiego (widzisz, ja też piszę "próba ma rozkład" :D). Czasem patrząc na histogram widzimy, że to "coś" nawet nie stało koło rozkładu normalnego... ale różnica dystrybuanty empirycznej i teoretycznej jest dostatecznie mała (na zadanym poziomie istotności) i stosujemy (z duszą na ramieniu) test parametryczny :)Adrian Olszewski edytował(a) ten post dnia 12.05.12 o godzinie 02:56
Jacek P.

Jacek P. Statystyk, kierownik
zespołu analityków

Temat: Co jest prawdopodobne w przedziale ufności?

Adrian Olszewski:
Na mojej stronie firmowej, która właśnie powstaje, właśnie chcę umieścić, w ramach "bazy wiedzy" sekcję o najczęstszych błędach interpretacji w statystyce. "Mniej/bardziej istotne", "brak odrzucenia H0 = jej przyjęcie", bieżący temat o interpretacji CI, "istotność kliniczna i statystyczna", "mieszanie jajek z pęcherzem w metaanalizie", "wąsy na wykresie słupkowym (95%CI, SE, SD) a stat. istotnie różnice", "próba ma rozkład normalny - próba pochodzi z rozkładu normalnego", "rozkład zmiennej vs. rozkład reszt w MNK", "test Wilcoxona jest święty" i wiele, wiele innych, zebranych przez lata kwiatków :)
czekam z niecierpliwością na tę stronę, i myślę że nie tylko ja ;)

konto usunięte

Temat: Co jest prawdopodobne w przedziale ufności?

Adrian Olszewski:
Czasem patrząc na histogram widzimy, że to "coś" nawet nie stało koło rozkładu normalnego... ale różnica dystrybuanty empirycznej i teoretycznej jest dostatecznie mała (na zadanym poziomie istotności) i stosujemy (z duszą na ramieniu) test parametryczny :)
Tak i nie.
Raz: moc i rozmiar wykorzystanego testu, jak wiemy tylko Szapiro-Wilk w małych próbach trzyma się zadanego rozmiaru i ma żądaną moc, w dużych (> 3000) jeszcze Doornik-Hansen. Reszta - bez komentarza.
Dwa: centralne twierdzenie graniczne, co oczywiście zmusza nas do odpowiednio dużych prób, ale wcale nie wyklucza stosowania pewnych testów (oczywiście ograniczamy się do wnioskowania klasycznego). Ważniejsze jest, aby uświadomić, że na podstawie malutkich prób nie tylko nie wolno stosować pewnych narzędzi jeśli nie mamy wiedzy co do spełnienia założeń, ale także aby wyjaśnić czym w istocie jest \alpha i zastanowić się - choćby na zasadzie analizy potwierdzającej - czy posiadając już pewną wiedzę a priori wnioskowanie bayesowskie nie daje odmiennych wyników. Bo często posiadamy już dość pokaźną wiedzę wstępną.

I tak tylko na marginesie: skróty myślowe weszły w krew tak bardzo, że czasem chyba sami ich nie dostrzegamy. Przykład: "Estymatory są statystykami - zależą od próby.". No właśnie NIE ZALEŻĄ, bo estymator jest funkcją i od próby zależy jedynie jej wartość, czyli OCENA PARAMETRU. Problem jest dość poważny, gdyż często (np. od studentów) wymagamy poprawności językowej i nie mylenia pojęć (np. szacowanego parametru, jego estymatora i oceny tegoż parametru), to sami na co dzień dopuszczamy się takich potworków.

Pozdrawiam
Marcin

Temat: Co jest prawdopodobne w przedziale ufności?

Dr Marcin Jan Błażejowski:
Tak i nie.
Raz: moc i rozmiar wykorzystanego testu, jak wiemy tylko

Tam pod tym linkiem a propos kryteriów stosowania testów (nie) parametrycznych była właśnie ciekawa dyskusja na statystycy.pl

To wszystko pokazuje nam, jak dużo wiedzy, czujności i intuicji potrzeba, żeby analizować dane a nie uprawiać "kreatywnej statystyki", przez którą potem się nam zarzuca, że "oszukujemy świat"...
"Estymatory są statystykami - zależą od próby.". No właśnie NIE ZALEŻĄ, bo estymator jest funkcją i od próby zależy

Fu....k ale wpadziocha :) To tak jak z "funkcja jest dodatnia...." (częste mylenie funkcji z jej wartością). No nic, muszę być bardziej czujny.
estymatora i oceny tegoż parametru), to sami na co dzień dopuszczamy się takich potworków.

Przejrzałem zeszyt ze statystyki z notatkami z wykładów - już kilka kwiatków, które zanotowałem z wykładu znalazłem :)
Chyba każdy kiedyś się wkurzał trochę, jak matematyk w szkole obniżał ocenę albo stawiał dwóję za niepoprawne wysławianie się... Chociażby "nieśmiertelne" odwzorowanie "na zbiór" i "w zbiór" :] ... injekcja, suriekcja...
Pozdrawiam
Marcin

Dzięki za czujność, również pozdrawiam :)Adrian Olszewski edytował(a) ten post dnia 13.05.12 o godzinie 14:42

Następna dyskusja:

Przedziały ufności - detal




Wyślij zaproszenie do