Temat: Nieoczekiwany efekt podkowy

Witam. Mam dosyć nietypowy (a może jednak typowy) problem:

Wziąłem sobie osiem zmiennych porządkowych z PGSS2002, dotyczących zainteresowania respondentów poszczególnymi tematami pojawiającymi się w mediach. Zmienne kodowane są na skali od 1 do 4, gdzie 1 oznacza najwyższe, a 4 najsłabsze zainteresowanie danym tematem.

Na początek, wbrew wszelkim prawidłom sztuki zrobiłem na nich PCA. Wnioski:

Dwa, ewentualnie 3 wymiary
1 wymiar: tematy z zakresu polityka, ekonomia, społeczeństwo, technika
2 wymiar: tematy kobiece

Jedynie "życie sławnych ludzi" ładuje się dość mocno na obu, stąd ewentualnie możliwość dodania do analizy 3-ciego wymiaru.

Współrzędne punktów:


Obrazek

Rotacja Varimax
Współrzędne punktów reprezentują średnie wartości czynnikowe dla poszczególnych grup.

Wariancja wyjaśniona:

Wymiar1: 35%
Wymiar2: 22%
Łącznie: 57%

Następnie na tych samych danych zrobiłem CATPCA. Wnioski podobne, generalnie więcej wyjaśnionej wariancji dzięki skalowaniu optymalnemu plus trochę inna rotacja, ale generalnie na jedno wychodzi.


Obrazek

Wszystkie zmienne wyskalowane jako porządkowe (niesklejana).

Wariancja wyjaśniona:

Wymiar1: 46%
Wymiar2: 22%
Łącznie: 69%

I na końcu, jeszcze raz te same dane, ale tym razem wielowymiarowa analiza korespondencji. Spodziewałem się podobnych wyników, ale okazuje się, że jest kompletnie inaczej:

- Efekt "podkowy" wskazuje na względną jednowymiarowość badanego zjawiska
- Jednocześnie drugi wymiar wyjaśnia zdecydowanie więcej bezwładności niż przy pozostałych dwóch
- Linie interpolacji wszystkich zmiennych przebiegają podobnie - nie ma rozróżnienia pomiędzy wymiarami.


Obrazek


Bezwładność wyjaśniona:

Wymiar1: 42%
Wymiar2: 31% (wtf?)
Łącznie: 73%

No i tu pojawia się jedno pytanie: DLACZEGO?

Jestem jeszcze kompletnym żółtodziobem w kwestiach skalowania optymalnego, więc b. proszę o pomoc.

Pzdr!
SopelPaweł Sopel edytował(a) ten post dnia 29.01.10 o godzinie 11:00

konto usunięte

Temat: Nieoczekiwany efekt podkowy

Na pierwszy rzut oka, wielowymiarowa analiza korespondencji wyodrębniła wymiar skrajności odpowiedzi. Osoby skłonne udzielać odpowiedzi skrajnych (1 lub 4) w odpowiedzi na jedno pytanie z większym prawdopodobieństwem udzielają odpowiedzi skrajnych na inne; osoby udzielające odpowiedzi umiarkowanej (2 lub 3) są względnie bardziej skłonne do udzielania podobnej odpowiedzi na inne pytanie. O ile narzucenie skali interwałowej (w klasycznej PCA) lub porządkowej (CATPCA ze zmiennymi porządkowymi) wymusiło koncentrację na kierunku preferencji, tak dopuszczenie braku monotoniczności kwantyfikacji wskazało na ich ogólniejszy charakter (albo charakter narzędzia).

Temat: Nieoczekiwany efekt podkowy

Taka interpretacja jest wygodna, ale nie do końca uzasadniona. Problem polega na tym, że punkty na wykresie układają się w kształt podkowy. Ma to swoją nazwę - "efekt podkowy" bądź "horseshoe effect" i oznacza mniej więcej tyle, że zjawisko ma w istocie jednowymiarową strukturę, natomiast drugi wymiar jest artefaktem matematycznym, który dodatkowo "oddala" od siebie sąsiadujące kategorie.

Na wykresie możemy zaobserwować charakterystyczny kształt podkowy. Jest to
zjawisko dobrze znane wszystkim badaczom korzystającym z analizy korespondencji.
Występuje w sytuacji, gdy struktura zjawiska ma charakter zasadniczo jednowymiarowy.
Drugi wymiar jest w takiej sytuacji artefaktem matematycznym (składnik kwadratowy
wielomianu) i nie wnosi nic do interpretacji merytorycznej poza wprowadzeniem
dodatkowego kontrastu pomiędzy kategoriami najzamożniejszymi i najuboższymi, gdy
odległość pomiędzy punktami mierzymy idąc kolejno od kategorii do kategorii zgodnie z ich
uporządkowaniem na pierwszym wymiarze (por. na temat Ñefektu podkowyî: Van de Geer
1993b; Weller, Romney 1990).
Źródło: Górniak, Jarosław. Zastosowanie Analizy Korespondenji w Badaniach Społecznych i Marketingowych. ASK. Społeczeństwo. Badania. Metody (numer jakiś archiwalny, nie wiem, który).

konto usunięte

Temat: Nieoczekiwany efekt podkowy

Świetnie, git, wiesz już, czym jest "efekt podkowy" :D.

Czy zatem Twój problem polega na tym, że nie otrzymałeś w ostatnim rozwiązaniu składowej odpowiadającej "zainteresowaniu światem" i kolejnej dla "tematów kobiecych"? Skoro dwa pierwsze
wymiary otrzymane w rozwiązaniu nie narzucającym ograniczeń na zmienne to skrajność postaw i jej "echo", to czy próbowałeś wyodrębniać kolejne? Trudno powiedzieć, na ile kolejne wymiary liniowo niezależne w stosunku do już wyodrębnionych będą przypominać to, co uzyskałeś z analizy zakładającej ograniczenia na zmienne, ale warto to sprawdzić.Rafał Bera edytował(a) ten post dnia 29.01.10 o godzinie 13:27

Temat: Nieoczekiwany efekt podkowy

Zrobiłem tak jak powiedziałeś, i chyba Bingo :D

Poniżej masz rzut na wymiary 1 i 3:


Obrazek


I tu już widać rozróżnienie między niusami i damskimi tematami całkiem wyraźnie. Co więcej, wymiar 3 wyjaśnia 22% bezwładności, czyli tyle, co "kobiecy" w CATPCA, a nieszczęsne "życie sławnych ludzi" jakby nie wiedziało do końca, gdzie się uplasować - czyli znowu jak w CATPCA.

Zatem mamy do czynienia z ciekawą sytuacją, w której wymiar 1 i 3 mają interpretację, a drugi jest artefaktem matematycznym. Powoli zaczynam domyślać się przyczyny tego fenomenu, ale jeszcze trochę pomyślę.

Następna dyskusja:

Nowa akcja na facebooku. Do...




Wyślij zaproszenie do