Anna Z.

Anna Z. Student, Szkoła
Wyższa Psychologii
Społecznej w
Warszawie

Temat: Raport z badania

Jakie są zasady tworzenia raportu z przeprowadzonego badania? Co powinien zawierać,jak wyglądać?
Adrian Piasecki

Adrian Piasecki Senior Consultant
Predictive Analytics
Solutions

Temat: Raport z badania

Większość jest oparta o standardy APA
Agnieszka Skruczaj

Agnieszka Skruczaj Junior Consultant
Predictive Analytics
Solutions

Temat: Raport z badania

Każdy raport oparty na standardach APA składa się z:
1. strona tytułwa, czyli tytuł pracy, słowa kluczowe, twórca oraz pod czyim kierunkiem praca została napisana (zawsze na pierwszej stronie bez numeru),
2. streszczenie, czyli krótkiego opisu tego co badaliśmy i jak, kogo badaliśmy, jakie uzyskaliśmy wyniki czy potwierdziliśmy nasze założenia (zawsze na oddzielnej stronie),
3. wstęp teoretyczny, czyli od ogółu do szczegółu, opis teorii na podstawie której postawiliśmy nasze hipotezy,
4. hipotezy i pytania badawcze (mogą sie one znajdować na końcu wstępu teoretycznego, jako wnioski z analizy teorii),
5. metoda czyli opis osób badanych, urzytych w badaniu narzędzi, procedura przeprowadzanego badania, (każda ze składowych odzielnie wyeksponowana w rozdziale)
6. wyniki, czyli co pokazało nasze badanie, suche wyniki bez zbędnych komentarzy, tabele i wykresy, potwierdzenie bądź odrzucenie hipotez,
7. dyskusja wyników, czyli co "nam wyszło" i dlaczego oraz co nie zostało potwierdzone i dlaczego, co możnaby zmienić w badaniu, co mogło wpłynąć na uzyskane wyniki,
8. literatura cytowana,
9. załączniki (kwestionariusze, testy, baza danych)
Adrian Piasecki

Adrian Piasecki Senior Consultant
Predictive Analytics
Solutions

Temat: Raport z badania

Przykładowy fragment z badania w którym zastosowano test t dla prób niezależnych

Poziomu agresywności badanej osoby:
Wynik testu t(31)=-2,397; p<0,05 wskazuje na to, że grupy z pełnej i niepełnej struktury rodziny różnią się od siebie pod względem poziomu agresywności, gdzie struktura rodziny niepełna uzyskuje istotnie wyższe wyniki M=8 , niż struktura pełna M=5,9.

Porównywane grupy osób z dużego i małego miasta pod względem poziomu agresywności istotnie różnią się od siebie t(31)=-3,73; p<0,001, gdzie osoby dużego miasta uzyskiwały wyższe wyniki M=8,9 niż osoby z małego miasta M=6,4.
Agnieszka Skruczaj

Agnieszka Skruczaj Junior Consultant
Predictive Analytics
Solutions

Temat: Raport z badania

Analiza wariancji:
Przykładowy opis analizy do raportu:
Pytanie badawcze:
Czy rodzaj stosowanego magnezu wpływa na poziom koncentracji?
Zmienne:
Zależna: poziom koncentracji
Niezależne:
- grupa (2 poziomy): młodzież (11-17 lat), dorośli (18-30 lat)
- magnez (2 poziomy): w tabletkach, w płynie
Schemat badania:2x2
Hipotezy:
Ho- Rodzaj stosowanego magnezu nie wpływa na poziom koncentracji osób badanych.
Hka- Osoby badane stosujące magnez w tabletkach mają wyższy poziom koncentracji niż osoby stosujące magnez w płynie.
Hkb- Młodzież ma wyższy poziom koncentracji niż dorośli.
Interpretacja :
Sprawdzano czy rodzaj stosowanego magnezu wpływa na poziom koncentracji u osób badanych. W tym celu przeprowadzono 2-czynnikową analizę wariacji w schemacie 2x2, która ujawniła szereg istotnych efektów:
a). Efekt główny grupy: F(1; 76) = 151,06 ; p<0,001, (eta2 = 0,67)- pokazuje, że młodzież wykazują wyższy poziom koncentracji ( M= 17,66 ; SD= 5,79) niż dorośli (M=7,64 ; SD=5,22). Siłę tego efektu można określić jako dużą.
b). Efekt główny magnezu: F(1;76)= 100,795 ; p<0,001 , (eta2=0,57) pokazuje, że osoby badane mają wyższy poziom koncentracji po zażyciu magnezu w tabletkach (M= 16,74 ; SD= 6,67) niż po zażyciu magnezu w płynie (M= 8,56 ; SD= 5,78). Siłę tego efektu można określić jako dużą.
c). Efekt interakcji grupa x magnez: F(1;76)= 1,78 ; p> 0,05 , (eta2= 0,23). Analiza ujawniła nieistotny efekt interakcji badanych zmiennych.Agnieszka Skruczaj edytował(a) ten post dnia 17.04.12 o godzinie 15:01
Agnieszka Skruczaj

Agnieszka Skruczaj Junior Consultant
Predictive Analytics
Solutions

Temat: Raport z badania

Analiza regresji liniowej:
Problem badawczy:
W jakim stopniu możemy przewidzieć zadowolenie z podjętej decyzji zakupu znając czas poświęcony na myślenie o zakupie?
W jakim stopniu możemy przewidzieć zadowolenie z podjętej decyzji zakupu znając przeznaczoną na zakup kwotę?
Zmienne:
Przewidywana: zadowolenie z decyzji zakupu
Predykator 1: czas poświęcony na myślenie o zakupie
Predykator 2:kwota przeznaczona na zakup
Hipotezy:
H1: Im dłuższy czas myślenia o zakupie tym większy poziom zadowolenia z podjętej decyzji o zakupie.
H2: im wyższa kwota przeznaczona na zakup tym niższy poziom zadowolenia z podjętej decyzji o zakupie.
1 analiza
W celu sprawdzenia możliwości przewidywania poziomu zadowolenia z zakupu na podstawie czasu poświęconego na myślenie o zakupie przeprowadzono analizę regresji. Zaproponowany model liniowy okazał się być istotny, F(1,118) = 49,08 ; p < 0,001. Wyjaśnia on 29% wariancji zmiennej zależnej. Wartość współczynnika b1 wynosi 0,29; t(118) = 7,01 ; p < 0,001. Oznacza to, że im dłuższy czas myślenia o zakupie tym wyższy poziom zadowolenia z zakupu. Z każdą minutą myślenia o zakupie (o ile zmienna jest podawana w minutach bo tego nie ma w danych) mamy szanse być o 0, 29 punkta (0,29x nasza jednostka czyli 1 punkt chyba bo nie jest nigdzie podane) na skali bardziej zadowoleni z dokonanego zakupu.
Odnosząc się do ustalonego modelu regresji możemy przewidzieć że nasze zadowolenie z zakupu po 20 minutach myślenia o zakupie będzie się mieściło w przedziale od 56,79 do 45,13 punktów na skali zadowolenia.
Agnieszka Skruczaj

Agnieszka Skruczaj Junior Consultant
Predictive Analytics
Solutions

Temat: Raport z badania

Analiza regresji wielokrotnej:
W celu sprawdzenia czy na podstawie neurotyzmu, sumienności, ekstrawersji, ugodowości i otwartość na doświadczenia można przewidzieć sukces zawodowy przeprowadzono analizę regresji wielokrotnej.
Po przeprowadzeniu analizy okazało się, że ekstrawersja r = 16 ; p = n.i. i ugodowość r = 16 ; p = n.i. nie korelują z sukcesem zawodowy- p > 0,05. Natomiast wyniki pokazują, że występuje dodatnia korelacja sukcesu zawodowego z neurotyzmem, sumiennością i otwartością na doświadczenie ( r neurotyzm = 0,46 ; p < 0,001, r sumienność = 0,46 ; p < 0,001, r otwartość na doświadczenie = 0,54; p < 0,001). Oznacza to, że wraz ze wzrostem tych predykatorów rośnie poziom sukcesu zawodowego.
Otwartość na doświadczenie tłumaczy 29% zmienności poziomu sukcesu zawodowego, natomiast otwartość na doświadczenie i sumienność tłumaczą razem 40% zmienności poziomu sukcesu zawodowego. Różnica ta jest istotna statystycznie., można więc przyjąć, że sumienność jest dobrym uzupełnieniem predykcji.
W analizie nie pojawia się neurotyzm, oznacza to, że nie wnosi on istotnej różnicy do powstałego już modelu.
Na podstawie analizy wariancji ustalono, że obliczany model, w lepszym stopniu pozwala przewidzieć wyniki, niż przewidywanie oparte na średniej F (2,97) = 33,91 ; p < 0,001.
Wszelkie przewidywania poziomu sukcesu zawodowego, oparte na otwartości na doświadczenie i sumienności obarczone są błędem = 3,56 punkta na skali oceniającej poziom sukcesu zawodowego.
Na podstawie obliczonego równania regresji, można powiedzieć, że otwartość na doświadczenie jest lepszym predyktorem (beta=0,46) sukcesu zawodowego niż sumienność (beta=-0,36).
Wartość współczynników równania regresji pokazuje, że wzrost otwartości na doświadczenia powoduje wzrost sukcesu zawodowego o 0,35 , natomiast wzrost sumienności powoduje wzrost sukcesu zawodowego o 0,23.
Równanie regresji: (y=b0+b1xX1+b1xX2). Przyjmując, że osoba badana ma 12 punktów na skali otwartości na doświadczenie i 15 na skali sumienności oznacza to, że y = 21,11+0,35x12+0,23x15. Przewidywana wartość poziomu sukcesu zawodowego wynosi 28,76 punkta na skali sukcesu zawodowego, biorąc pod uwagę błąd jakim są obarczone wyniki poziom sukcesu zawodowego będzie się mieścił w przedziale od 25,20 do 32,32 punkta na skali.

Temat: Raport z badania

Dobry wieczór :)

Pozwolę sobie uzupełnić Państwa przykłady (uważam, że robicie fajną i potrzebną robotę) moje skromne 2 grosze, wynikające z osobistych doświadczeń z analiz klinicznych.

1. P-value niższe niż zadany poziom istotności raportuje się z użyciem tego poziomu (p<0.05 zamiast p=0.000032 albo p<0.00001). Owszem, p może to świadczyć o sile efektu, ale pod warunkiem, że znana jest licznośc próby i zachowane są założenia co do rozkładu (a to jest grząski grunt). Owszem, przy badaniach eksploracyjnych (nie mylić z typowym data miningiem), czyli takich, gdzie nie mamy za bardzo koncepcji badawczej i badamy "co się da" raportuje się "dokładne" pval. Jeśli jednak nie zajmujemy się badaniami eksploracyjnymi (ad hoc), tylko weryfikujemy postawione na początku badania hipotezy, nie "ulepszajmy" wyniku podając skrajnie niskie p, tylko trzymajmy się p.ist. Jeśli badamy coś na założonym a=0.05, to raportujmy p-val w relacji do 0.05.

No dobrze, z jednym wyjątkiem - spotyka się zalecenia, by prawdopodobieństwo p większe niż zadany poziom istotności raportować jako dokładną wartość (p=0.94 zamiast p>0.05).

2. Zawsze dobrze jest podawać obok p-val przedział ufności na zadanym poziomie istotności. Są długie dyskusje na temat tego, dlaczego "p-value is evil" (czasem nieco "na siłę"). Tutaj jednak nie ma sensu dzielić włosa na czworo i warto raportować zarówno pval jak i CI.

3. Zawsze należy raportować liczność prób (najlepiej na początku). Definicje prób, warunki włączenia i wyłączenia obserwacji z/do analizy oraz ich statystyki opisowe (z naciskiem na pozycyjne) , polityka uzupełniania ("imputacji") danych itp. są często pożądane.

4. ... i zaznaczać, kiedy próby nie są równoliczne.

Niezrównoważone próby przy >1 czynnikowej analizie wariancji to pasmo problemów. Wtedy potencjalny czytelnik/słuchacz/odbiorca może zadać pytanie o postać badanego modelu (regresja liniowa - i jakie kontrasty, ANOVA, a ogólnie - który typ sumy kwadratów był użyty i dlaczego).

Zwłaszcza, gdy korzysta się z kilku programów (R, S+, SPSS, SAS) trzeba pilnować użytych kontrastów i typów SS.

5. Starajmy się sygnalizować, że wykonaliśmy analizę "przy spełnionych założeniach metody" jeśli wszystko było OK bądź sygnalizować, które założenia zostały naruszone. Oczywiście wtedy narażamy się na uzasadnienie przyjętej metody, co czasem jest proste, a czasem nie. Analiza założeń bywa męcząca, zwłaszcza, gdy wynika z nich, że nie mamy alternatywnych narzędzi analitycznych (prawie zawsze je mamy, chociaż czasem nawet owe alternatywne nieparametryczne narzędzia stosujemy nieprawidłowo). To upewnia czytelnika, że analityk panuje nad wszystkim i wykonuje analizę lege artis. Że wyniki mają umocowanie w teorii, że recenzent nie odrzuci artykułu, że w razie rozprawy sądowej analityk konkurencji nie podważy naszych oszacowań.

Dodatkowo analiza spełnienia założeń może doprowadzić nas do interesujących odkryć, przez co będziemy mogli zasugerować klientowi dalsze analizy (post factum). Z drugiej strony analiza założeń "w łańcuszku" może prowadzić (i prowadzi) do znacznego rozrostu błędu I rodzaju - a o tym się rzadko mówi(!). Przygotowuję artykuł na zbliżony temat.

6. Modele regresji należy podawać razem z błędami standardowymi (nie musi być istotności) oraz błędem modelu.

7. I na koniec jeszcze jedna uwaga - jeśli współczynniki dopasowania modelu są niskie, zanim opublikujemy wnioski w oparciu o ten model, poszukajmy innych klas modeli. Czasem jesteśmy w prawdziwym problemie, bo np. korelacja między zmiennymi jest na tyle niska, że nie tylko regresja liniowa nie pomoże, ale w ogóle żadna transformacja ani nawet modele addytywne - no praktycznie nic. Ale może wtedy pomoże regresja segmentowa - bo w określonych przedziałach dopasowanie jest bardzo dobre? Czasem mamy w próbie wymieszane obserwacje z kilku rozkładów i one się wzajemnie maskują. Miałem takie przypadku przy badaniu skuteczności leków - wymieszano mi pacjentów o różnym stanie klinicznym; dopiero analiza znaczenia poszczególnych parametrów klinicznych wskazała, że niektórzy są "OK", a niektórzy - w stanie silnej patologii. Tutaj czasem pomaga na początku analiza dyskryminacyjna, która wydzieli jednolite pod jakimś względem grupy obserwacji.

8. Bardzo dobrze, że podajecie Państwo "słowne oszacowanie" wielkości efektu wynikający z merytoryki zagadnienia. Często, niestety, spotykam się z pracami analityków, gdzie o "sile efektu" decyduje p-value. A przeciez istotność statystyczna to nie to samo, co istotność "merytoryczna" (w moim przypadku - kliniczna).

Oczywiście - trudno raportować wszystkie powyższe informacje w każdym opracowaniu.

Niektóre opracowania są naprawdę proste. A niektóre - wręcz przeciwnie, wymagają wielkiej precyzji w opisie procesu. Jeśli informacji jest dużo, można sobie radzić na różne sposoby - np. osobnym rozdziałem z dyskusją użytych metod, bądź po prostu przypisami (strony bądź końcowymi):

jednoczynnikowa parametryczna analiza wariancji wykazała statystycznie istotny wpływ XXXX na YYYYY [1]
.... ... ... ...
_______________________
*1 przy spełnionych założeniach dotyczacych:
a) homogeniczności wariancji w próbach - zweryfikowano testem Levena (p=0.39)
b) pochodzenia badanych prób z populacji o rozkładzie normalnym - zweryfikowano testem Andersona-Darlinga (p=0.45)

....etc.

Zawsze trzeba ustalić jakiś kompromis w zakresie szczegółowości raportowania tak, by z jednej strony nie zapomnieć "posolić wody do gotowania ziemniaków", a z drugiej - nie przesolić jej :)Adrian Olszewski edytował(a) ten post dnia 24.10.12 o godzinie 00:36
Adrian Piasecki

Adrian Piasecki Senior Consultant
Predictive Analytics
Solutions

Temat: Raport z badania

Witam swojego imiennika :)

Swoją wiadomością zawarł Pan komplet informacji odnośnie "najistotniejszych" kwestii związanych z przygotowaniem odpowiedniego raportu i niuansów odnośnie złych doborów analiz.

Tu mały podział ze względu na staż przykładowego analityka/badacza.

O ile mamy z góry ustalony model, początkowy badacz powinien kłaść przede wszystkim nacisk na dokładny zapis przeprowadzonych analiz tak aby niczego nie pomijać ( jak Pan wspomniał, z jednej strony aby nie narażać się na zakwestionowanie ich przez innego analityka, bądź na pytania ze strony recenzenta, na które nie będzie w stanie udzielić jednoznacznej odpowiedzi). Jest wiele różnych standardów zapisu testów czy to np. tak jak Pan wspomniał w legendzie, tabeli, wykresie czy zapis w tekście. Dobór odpowiedniego zapisu często jest uzależniony brenchmarku organizacji, w której się pracuje lub, która zleca przeprowadzenie badań. Często w skład zadań takiego analityka wchodzi wykonywanie statystyk opisowych poszerzonych o podstawowe testy różnic lub związków. Początkowym analitykom polecam zawsze testować rozkład i weryfikować założenia testów przed wyborem danego rodzaju analizy aby nie zapędzić się w przysłowiowy "kozi róg" i zapisywać dokładnie cały proces przeprowadzonych analiz.

Bardziej zaawansowani badacze sami dobierają odpowiedni model prezentując uzyskane przez siebie wyniki. Zapis ich ma być przystępny i zrozumiały dla potencjalnego czytelnika "laika". Ci analitycy krok po kroku analizują uzyskane wyniki z analizy i na ich podstawie dobierają kolejne. Potencjalnego klienta w tym wypadku bardziej interesuje końcowy efekt niż sposób jego powstawania. Doświadczony analityk też człowiek i może się pomylić. O ile klient tego nie wymaga nie powinno się zapominać o zapisie procedury przeprowadzonych analiz i przechowywać je gdzieś w bezpiecznym miejscu.

Temat: Raport z badania

.Ten post został edytowany przez Autora dnia 17.09.23 o godzinie 18:54

Następna dyskusja:

Badania rynku




Wyślij zaproszenie do