Temat: Analiza przeżycia - pytanie.

Robię analizy przeżycia - ekspresja pewnego białka jako podstawowy czynnik. Oryginalnie mierzona w skali od 1-12 (bez jednostek). Analizy muszą być jednak zrobione dla dwóch grup - o niskiej i wysokiej ekspresji. Żeby znaleźć optymalny punkt podziału zastosowałem bardzo proste drzewo C&RT. Wyszło, że najlepiej dzielić tak: 1-9 niska, 10-12 wysoka. Co więcej taki podział, dzieli populację m/w pół na pół, więc myślę, że jest uzasadniony.

Do analizy stosuję generalnie dwie metody i porównuje ich wyniki - Kaplana-Meiera z testem LogRank, i Regresję Coxa (PH), do której wrzucam też dodatkowe czynniki. Dotychczas zawsze miałem taką sytuację, że, nawet jeśli inne czynniki włączone do modelu Coxa również miały wpływ na hazard, to generalnie Cox potwierdzał wnioski KM. Teraz mam dziwną sytuację:

W log-rank mam istotność 0,024, czyli niby istnieje różnica w prawdopodobieństwach przeżycia między grupami.

W Coxie iloraz ryzyka dla tego samego czynnika (kontrast wskaźnikowy, kategoria odniesienia 1-9) wynosi nieco ponad 1,1 a p-value 0,737, czyli zupełnie inny wniosek niż przy KM.

N to nieco ponad 200.

Co może być tego przyczyną?

Dodam, że analizy przeżycia to w ogóle nie moja broszka, ja jestem socjologiem :) Po prostu muszę komuś zrobić przysługę, a przy okazji trochę się uczę, więc błagam, nie wypominajcie mi głupich błędów tylko zwróćcie na nie uwagę :)
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Analiza przeżycia - pytanie.

Czy przed dodaniem innego czynnika różnica była istotna? Czy testowałeś założenie proporcjonalnych hazardów w modelu Coxa?
Jak odpowiesz na te dwa pytania możemy szukać dalej przyczyny.

Temat: Analiza przeżycia - pytanie.

PH sprawdzone "na oko" metodą wykresów reszt cząstkowych od czasu.

Za to model z jednym predyktorem nagle okazał się istotny. Po włączeniu wszystkich predyktorów istotny jest już inny czynnik. Okazuje się, że oba są ze sobą skorelowane (oba są jakościowe, p-value w tescie Chi^2 < 0,001).

Czyli mam rozumieć, że Kaplan-Meier pokazał pozorną zależność, która tak naprawdę wynikała ze skorelowania predyktora z jakimś innym, ważniejszym?
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Analiza przeżycia - pytanie.

A czy Kaplan-Meier był dla analizy jednoczynnikowej, jeżeli tak to twoja odpowiedź jest prawidłowa. Pozostaje jeszcze zerknąć na błędy standardowe w modelu Coxa przed i po włączeniu drugiej zmiennej. Jeżeli jest duża różnica to można mieć podejrzenia co do modelu wieloczynnikowego (chodzi o rozstrzygnięcie która zmienna jest tak naprawdę istotna).

Temat: Analiza przeżycia - pytanie.

KM był dla analizy jednoczynnikowej.

Analiza generalnie dotyczy wpływu jednego czynnika na przeżycia (to jest podstawowa hipoteza badawcza i po to w ogóle całe badanie). Teoretycznie więc jednoczynnikowy KM jest jak najbardziej na miejscu. Cox ma za zadanie wyłapać ten wpływ przy korekcji na pozostałe istotne statystycznie predyktory, które również są w zbiorze danych.
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Analiza przeżycia - pytanie.

W badaniach obserwacyjnych zawsze (o ile to możliwe) najważnieszy jest model wieloczynnikowy, choć prawie zawsze trzeba rozpoczynać analizę od modelu jednoczynnikowego.
W badaniach randomizowanych najważniejszy jest model jednoczynnikowy ale gdy zmienna zależna jest ciągła to warto w analizie uwzględnić inne silne predyktory. Czasem w badaniach randomizowanych może być ważne poszukiwanie zmiennych modyfikujących efekt.

Temat: Analiza przeżycia - pytanie.

Dane są z badań obserwacyjnych (kilkanaście lat), ale hipoteza badawcza dotyczy wpływu jednego czynnika, który został zmierzony jednorazowo (jest niezależny od czasu) i dołączony do zbioru danych po numerze pacjenta.
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Analiza przeżycia - pytanie.

Może jednak powinienem coś napisać o wnioskowaniu przyczynowo-skutkowym na podstawie badań obserwacyjnych. Swoją drogą byłaby to kontynuacja wątku który rozpocząłem w innej grupie.

Temat: Analiza przeżycia - pytanie.

Związkami przyczynowo-skutkowymi akurat się tu nie przejmuję. Jest mocna teoria, która sugeruje poprawność hipotezy, ja tylko ją konfirmuję. Poza tym to co robię, to jest trochę kalka analogicznej analizy na innych danych i w oparciu o inne białko.
Wojciech Sobala

Wojciech Sobala Redaktor
statystyczny,
biostatystyk,
Instytut Medycyny
Pr...

Temat: Analiza przeżycia - pytanie.

Jeżeli teoria jest "mocna" to po co ją potwierdzać. Jeżeli teoria jest "mocna", to włączenie innych czynników nie powinno prowadzić do braku istotności. Chyba, że jedna lub więcej z uwzględnionych zmiennych w modelu wielozmiennowym jest na ścieżce przyczynowo-skutkowej pomiędzy badaną zmienną a przeżyciem.

Temat: Analiza przeżycia - pytanie.

Problemem, z jakim się Pawle borykasz, może być maskowanie, które jest przekleństwem wielu analiz, gdy nie przeprowadzi się identyfikacji grup, wyznaczonych wartościami pewnych zmiennych.

KM jest nieparametryczną metodą analizy "with no covariates", w odróżnieniu od semiparametrycznego modelu regresji Coxa, specjalnie "zaprojektowanego" do obsługi zmiennych towarzyszących.

Gdy przeprowadzałem analizy przeżycia dla pewnego projektu z dziedziny kardiologii, dzieliliśmy grupy pacjentów wg klas schorzeń. Między tymi klasami były istotne różnice m.in. w zakresie prawd. zgonu w ciągu krytycznego pierwszego tygodnia od zabiegu. Potraktowanie danych całościowo byłoby tu wybitnie nie na miejscu. Czy jednak nasz podział był właściwy? Wszystko w rękach lekarzy.

Jeśli masz zmienne towarzyszące ilościowe, bierzesz na tapetę Coxa, albo jakąś parametryczną EHA, jeśli potrzeba (AFAIK rzadko potrzeba). Jeśli jakościowe, oprócz Coxa możesz użyć KM, ale koniecznie w ramach grup. A i to nie daje gwarancji, że zrobiłeś to właściwie. Cox bada wszystko, co mu wrzuciłeś na wejście. W KM Ty sam decydujesz, której zmiennej użyjesz jako generatora grup, ale nie wiesz, czy nie ma maskowania ze względu na inne zmienne.

Wszystko zależy od badania.

Aha, nigdy nie ufaj algorytmom automatycznego wyszukiwania punktów podziału, bo mogą się mieć nijak do wiedzy klinicznej, nawet, jeśli maksymalizują wariancję międzygrupową. Zawsze trzeba zapytać osobę, która posiada merytoryczne przygotowanie do interpretacji wyników. Czasem sami "branżowcy" spierają się o takie punkty (naciąłem się na to i musiałem powtarzać żmudne analizy dla różnych progów) i lepiej być poza ich konfliktem :)Adrian Olszewski edytował(a) ten post dnia 14.04.10 o godzinie 14:06

Następna dyskusja:

pytanie sondazowe




Wyślij zaproszenie do