Komentarz: zderzają się trzy światy: błąd berksona, błąd selekcji i błąd Zderzacza

błąd Berksona
kierowane wykresy acykliczne (dag)
składniki błędu berksona
siła i kierunek odchylenia
finansowanie
podziękowania

błąd Berksona

w 1984 roku jeden z nas (N. P.) mieszkał na plaży w Nowej Zelandii. Pisałem pracę doktorską, kiedy miałem kontuzję piłki nożnej („piłka nożna”), która dała mi poważny problem z plecami przez tydzień. Po pierwszych dwóch dniach leżenia na plecach słuchając muzyki i nie będąc w stanie zrobić wiele innego, obudziłem się w środku nocy z nudnościami i zawrotami głowy najwyraźniej spowodowanymi infekcją ucha wewnętrznego. Przez następne pięć dni miałem silny ból pleców, gdy wstałem, silne nudności i zawroty głowy, gdy kładę się i mieszaninę tych dwóch, gdy siedziałem na krześle. Celem opowiedzenia tej żałosnej historii nie jest odniesienie mojej historii medycznej do czytelników IJE, ale raczej dlatego, że jest ona istotna dla historii stronniczości Berksona, którą studiowałem w tym czasie. Nie zostałem przyjęty do szpitala, ale to było bliskie i dało mi to doświadczenie z pierwszej ręki, w jaki sposób „osoby z dwiema lub więcej chorobami mają większe prawdopodobieństwo hospitalizacji niż osoby z jedną chorobą-nawet jeśli te wyniki są niezależne”.1 gdybym był hospitalizowany i zrekrutowany do badania infekcji ucha wewnętrznego i gdyby było wystarczająco dużo innych osób takich jak ja, prawdopodobnie przyczynilibyśmy się do fałszywego wniosku,że kontuzje piłkarskie (które spowodowały mój problem z plecami) były przyczyną infekcji ucha wewnętrznego—odpowiada to „pośredniej” formie błędu Berksona, 2 Jak przedstawiono na rysunku 3a w artykule Snoep et al.1

stronniczość Berksona (zwana także „błędem Berksona”) jest prawdopodobnie jedną z najbardziej znanych, ale najmniej zrozumiałych form stronniczości. Artykuł Snoep et al.1 wyjaśnia, czym jest błąd, dlaczego czasami ma znaczenie, ale dlaczego zwykle nie. skomentujemy trzy aspekty artykułu: (i) użycie ukierunkowanych grafów acyklicznych (dag); (ii) składniki błędu berksona; oraz (iii) prawdopodobną siłę i kierunek takich błędów.

kierowane wykresy acykliczne (dag)

artykuł Snoep et al. wyraźnie ilustruje siłę i elegancję skierowanych grafów acyklicznych (dag). To, co wcześniej staraliśmy się zrozumieć za pomocą słów, prawdopodobieństw i przykładów numerycznych, można teraz zgłębiać o wiele bardziej elegancko za pomocą diagramów przyczynowych. Stanowi to prawdziwy postęp i wyjaśnia wiele aspektów uprzedzeń Berksona.

bardziej ogólnie, dag wyjaśniły wcześniej mętną zależność między błędem wyboru a błędem. Tradycyjnie, błąd selekcji został opisany jako błąd wynikający z niewłaściwej selekcji (lub selekcji własnej) badanych z populacji źródłowej.3 na jednym poziomie jest to wystarczająco jasne, ale użycie słowa „selekcja” często prowadzi do tego,że termin ten jest stosowany do niewłaściwego doboru grupy porównawczej,co prowadzi do dezorientacji co do tego, czy zjawiska takie jak efekt zdrowego pracownika są przykładami bias selekcji4 lub mylące, 5, 6 sytuacja jest bardziej skomplikowana, ponieważ determinanty selekcji (np. wiek, płeć, pozycja społeczno-ekonomiczna) mogą skutecznie stać się czynnikami zakłócającymi i być kontrolowane w analizie, nawet jeśli nie były czynnikami zakłócającymi w populacji źródłowej. Stosowanie dag wyjaśnia to i rozróżnia między uprzedzeniami wynikającymi z (niewłaściwego) uwarunkowania powszechnymi skutkami („stronniczość Zderzacza” lub „stronniczość selekcji”) a brakiem uwarunkowań typowych przyczyn narażenia i wyniku (zakłócanie).6,7 te dwa zjawiska mogą wystąpić razem, np. gdy stan Zderzacza jest skutkiem przyczyny wyniku, a nie skutkiem samego wyniku. Niektórzy określiliby to jako błąd wyboru, a 6 innych uznałoby to za rodzaj zamieszania.8,9

tak więc, chociaż te trzy terminy są czasami używane prawie zamiennie, tendencja Zderzacza jest bardziej ogólnym zjawiskiem obejmującym uwarunkowanie powszechnymi skutkami (chociaż Hernan i in.6 używać terminu „błąd selekcji” dla tego bardziej ogólnego zjawiska); błąd selekcji jest wtedy szczególnym rodzajem błędu Zderzacza, w którym wspólnym efektem jest wybór do badania; Stronniczość berksona jest wtedy szczególnym rodzajem selekcji bias10, w którym wybór przypadków do badania zależy od hospitalizacji, a ekspozycja jest inną chorobą lub przyczyną innej choroby, która również skutkuje hospitalizacją. Jest mało prawdopodobne, aby można było to tak łatwo wyjaśnić bez użycia dag.

składniki błędu berksona

w swojej istocie błąd Berksona można postrzegać jako stronnicze oszacowanie szans na ekspozycję wśród przypadków, ponieważ narażone przypadki są identyfikowane z większym prawdopodobieństwem niż przypadki nieeksponowane, gdy wskaźnik hospitalizacji dla tych przypadków jest mniejszy niż 100%, a ekspozycja jest inną chorobą lub przyczyną innej choroby, która powoduje hospitalizację. Możliwe jest zilustrowanie za pomocą przykładów numerycznych różnych kroków zaangażowanych w stronniczość Berksona. Zacznijmy od populacji przedstawionej w tabeli 5 w artykule Berksona2, gdzie iloraz szans wynosi 1,0 (Tabela 1).

Tabela 1.

Stowarzyszenie w populacji ogólnej według raportu Berkson2

.
Cases	3000	97 000	100 000
Non-cases	297 000	9 603 000	9 900 000
Total	300 000	9 700 000	10 000 000

.	Exposed .	Unexposed .	Total .
przypadki	3000	97 000	100 000
bez przypadków	297 000	9 603 000	9 900 000
razem	300 000	9 700 000	10 000 000

iloraz szans = 1,0.

Tabela 1.

Stowarzyszenie w populacji ogólnej według raportu Berkson2

.		Unexposed .	Total .
Cases	3000	97 000	100 000
Non-cases	297 000	9 603 000	9 900 000
Total	300 000	9 700 000	10 000 000

.	Exposed .	Unexposed .	Total .
przypadki	3000	97 000	100 000
bez przypadków	297 000	9 603 000	9 900 000
razem	300 000	9 700 000	10 000 000

iloraz szans = 1,0.

Zakładamy teraz, że badanie porównuje hospitalizowane przypadki z ogólnymi kontrolami populacji(co odpowiada Fig. 1B Snoep et al.1). Stosujemy te same prawdopodobieństwa hospitalizacji dla choroby 1 (ekspozycja—0,15) i choroby 2 (przypadki—0,05) z artykułu Berksona. Zakładamy również (inaczej niż Berkson2 i Snoep et al.1) że cała populacja ma częstość występowania 0,2 i wskaźnik hospitalizacji 0,025 dla każdej innej choroby niż D1 i D2 (te różne założenia oznaczają, że nasze liczby są nieco inne od tych z Berkson2 i Snoep et al.1). Jeśli w badaniu porównano przypadki hospitalizowane z ogólnymi kontrolami populacji pobranymi z przypadków innych niż przypadki z ułamkiem próbkowania wynoszącym 10%, odpowiednie wyniki przedstawiono w tabeli 2. Szacowany współczynnik szans wynosi obecnie 3,59, ze względu na wyższe kursy ekspozycji w przypadkach hospitalizowanych (w porównaniu ze wszystkimi przypadkami). Jest to spowodowane przez odchylenie Zderzacza, jak pokazano na fig. 1B Snoep et al.1

Tabela 2.

Stowarzyszenie wykorzystujące przypadki hospitalizacji i ogólną kontrolę populacji

.			Total .
Cases	590	5311	5901
Controls	29 700	960 300	990 000
Total	30 290	965 611	995 901

.	Exposed .	Unexposed .	Total .
przypadki	590	5311	5901
kontrole	29 700	960 300	990 000
razem	30 290	965 611	995 901

iloraz szans = 3,59.

Tabela 2.

Stowarzyszenie wykorzystujące przypadki hospitalizacji i ogólną kontrolę populacji

.		Unexposed .	Total .
Cases	590	5311	5901
Controls	29 700	960 300	990 000
Total	30 290	965 611	995 901

.	Exposed .	Unexposed .	Total .
przypadki	590	5311	5901
kontrole	29 700	960 300	990 000
razem	30 290	965 611	995 901

iloraz szans = 3,59.

odpowiednie wyniki badań przeprowadzonych wśród pacjentów hospitalizowanych w tej samej populacji przedstawiono w tabeli 3. Tendencja jest teraz w przeciwnym kierunku, ponieważ wzrost kursów ekspozycji w przypadkach (w porównaniu ze wszystkimi przypadkami) jest bardziej niż równoważony przez jeszcze większy wzrost kursów ekspozycji w przypadkach innych niż przypadki (w porównaniu z ogólną populacją). Jest to ponownie spowodowane przez odchylenie Zderzacza, jak pokazano na fig. 1a Snoep et al.1

Tabela 3.

Stowarzyszenie wykorzystujące hospitalizowane przypadki i kontrole pacjentów hospitalizowanych z powodu jakiejkolwiek choroby, z częstością występowania 0,2 populacji i 0.025 prawdopodobieństwo hospitalizacji z powodu choroby innej niż D1 (ekspozycja) lub D2 (przypadki)

.
Przypadki	590	5311	5901
Kontrole	45 812	48 015	93 827
Razem	46 402	53 326	99 728

.
przypadki	590	5311	5901
kontrole	45 812	48 015	93 827
razem	46 402	53 326	99 728

iloraz szans = 0,12.

Tabela 3.

Stowarzyszenie za pomocą hospitalizowanych przypadków i kontroli od pacjentów hospitalizowanych z powodu każdej choroby, z 0.2 częstość występowania populacji i 0,025 prawdopodobieństwo hospitalizacji z powodu jakiejkolwiek choroby innej niż D1 (ekspozycja) lub D2 (przypadki)

.
Przypadki	590	5311	5901
Kontrole	45 812	48 015	93 827
Razem	46 402	53 326	99 728

.	Exposed .	Unexposed .	Total .
Cases	590	5311	5901
Controls	45 812	48 015	93 827
Total	46 402	53 326	99 728

Odds ratio = 0.12.

Tabela 4 pokazuje przykład bardziej podobny do Berksona, 2, w którym jedna konkretna choroba została wybrana do wyboru grupy kontrolnej i choroba kontrolna ma prawdopodobieństwo hospitalizacji 0,20 i częstość występowania 0,005; współczynnik szans wynosi teraz 2,26, a odchylenie jest teraz w przeciwnym kierunku do Tabeli 3, ponieważ wskaźnik hospitalizacji w przypadku choroby kontrolnej jest większy niż wskaźnik hospitalizacji w przypadku choroby (a zatem wzrost ekspozycji jest większy w przypadkach niż w grupach kontrolnych).

Tabela 4.

skojarzenie z kontrolami hospitalizowanymi z konkretną chorobą, z częstością występowania populacji 0,005 i prawdopodobieństwem 0,20 hospitalizacji z powodu choroby kontrolnej

.
Cases	590	5311	5901
Controls	480	9757	10 237
Total	1070	15 068	16 138

.	Exposed .	Unexposed .	Total .
przypadki	590	5311	5901
kontrole	480	9757	10 237
razem	1070	15 068	16 138

iloraz szans = 2,26.

Tabela 4.

Asocjacja z wykorzystaniem kontroli hospitalizowanych z konkretną chorobą, z częstością występowania w populacji 0, 005 i 0.20 probability of hospitalization for the control disease

.	Exposed .	Unexposed .	Total .
Cases	590	5311	5901
Controls	480	9757	10 237
Total	1070	15 068	16 138

.	Exposed .	Unexposed .	Total .
przypadki	590	5311	5901
kontrole	480	9757	10 237
razem	1070	15 068	16 138

iloraz szans = 2,26.

Tak więc, podczas korzystania z ogólnej kontroli populacji, błąd Berksona będzie miał tendencję do generowania podwyższonych współczynników szans (gdy wskaźnik hospitalizacji dla choroby przypadku jest mniejszy niż 100%); podczas korzystania z kontroli szpitalnych odchylenie może być w dowolnym kierunku.

siła i kierunek odchylenia

artykuł Snoep et al. nie tylko wyjaśnia te podstawowe mechanizmy stronniczości Berksona; zapewnia również szacunki jego siły i kierunku w różnych okolicznościach(patrz Snoep et al., Tabela 31). Pokazuje to, że gdy Berkson skonstruował scenariusz podobny do Tabeli 4, w którym wskaźnik hospitalizacji w chorobie kontrolnej (błędy refrakcji) był znacznie wyższy niż w przypadku choroby (cukrzyca)-0,2 w porównaniu z 0.05-współczynniki kursów były silnie tendencyjne w górę (linia 1 Snoep et al., tabela 31); gdy wskaźnik hospitalizacji jest niższy w chorobie kontrolnej, stosunek szans jest tendencyjny w dół(linie 4-5 W Tabeli 3 Snoep et al.1), podczas gdy nie ma stronniczości, gdy wskaźnik hospitalizacji jest taki sam dla obu chorób, a pacjenci, którzy mają zarówno przypadek, jak i chorobę kontrolną, są liczeni tylko jako przypadki (linie 8-9, Tabela 3 Snoep et al.1).

więc stronniczość Berksona z pewnością może wystąpić, ale czy to naprawdę ma znaczenie? Jak Snoep et al.1 Uwaga, przykład Berksona został oparty na hipotetycznym badaniu obejmującym związek między powszechnymi przypadkami a inną powszechną chorobą (ekspozycją). Gdy ekspozycja nie jest bezpośrednią przyczyną hospitalizacji, istotna jest tylko pośrednia forma uprzedzenia Berksona-jak przykład o problemie pleców spowodowanym kontuzją piłki nożnej (patrz wyżej). Stronniczość ta jest w dużej mierze osłabiona przez zastosowanie przypadków incydentalnych i można jej całkowicie zapobiec, wykluczając przypadki, które były hospitalizowane z powodu innej choroby. Widać to na przykładzie opisanym powyżej—Wiele osób z incydentalnymi infekcjami ucha środkowego musiałoby być hospitalizowanych z powodu równoczesnych urazów piłkarskich, aby wystąpić odchylenie materialne. W związku z tym w wielu (lub być może większości) prawdopodobnych sytuacjach odchylenie będzie bardzo małe, szczególnie w przypadku przypadków incydentalnych. Chociaż jest to teoretycznie interesujące, w praktyce w dużej mierze było to „wiele hałasu o nic”.

być może głównym przesłaniem jest to, że nie wystarczy jedynie wykazać, że błąd może wystąpić; konieczne jest również oszacowanie prawdopodobieństwa, że nastąpi, a także jego prawdopodobnej siły i kierunku. Badania epidemiologiczne są często krytykowane ze względu na potencjalne odchylenie od informacji lub szczątkowe pomieszanie. W niektórych przypadkach te potencjalne problemy są realne i ważne, w innych są trywialne. Metody bayesowskie stają się coraz bardziej dostępne do oceny prawdopodobnej siły i kierunku takich uprzedzeń.11

co prowadzi nas do ograniczeń dag. Praca berksona przyniosła ekstremalne wyniki, ponieważ opierała się na powszechnych przypadkach, sytuacji, której nie można łatwo przedstawić przez dag. Jeśli zmienimy z częstych przypadków na przypadki incydentów, wszystkie dag na rysunkach 1-6 w Snoep et al.1 nadal wyglądają tak samo, ale uprzedzenia na ogół stały się banalne. Ilustruje to bardziej ogólny problem dag – mogą one pokazać, że błąd może wystąpić, ale nie dostarczają szacunków jego prawdopodobnej siły i kierunku. Bez tego łatwo jest poddać się „paraliżowi analitycznemu”, który wynika ze strachu przed dostosowaniem się do potencjalnego Zakłócacza (który może być również zderzaczem na innej ścieżce), ponieważ może to spowodować stronniczość Zderzacza („lęk Zderzacza”). W niektórych sytuacjach odchylenie Zderzacza może być porównywalne z niekontrolowanym zakłócaniem.7 w innych nie będzie, a korzyści z kontrolowania zakłócania znacznie przewyższą skutki błędu Zderzacza. Wszystko zależy.

finansowanie

Centrum Badań nad zdrowiem publicznym jest wspierane przez Grant programowy z Health Research Council of New Zealand.

podziękowania

dziękujemy Janowi Vandenbroucke za komentarze do projektu rękopisu.

konflikt interesów: brak danych.

Snoep

Morabia

Hernandez-Diaz

Hernan

Vandenbroucke

a structural approach to Berkson ’ s fallacy: and a guide to a history of opinions about it

Int J Epidemiol

2014

;

515

–

Berkson

ograniczenia zastosowania analizy tabeli czterokrotnej do danych szpitalnych

Byk Biometryczny

1946

;

–

Rothman

Grenlandia

Lash

Ważność w badaniach epidemiologicznych

. W:

Grenlandia

Lash

(eds).

Współczesna Epidemiologia

. 3.edn.

Philadelphia, PA

Lippincott Williams & Wilkins

2008

Checkoway

Pearce

Crawford-Brown

metody badawcze w Epidemiologii zawodowej

Nowy Jork

1989

Checkoway

Pearce

Kriebel

metody badawcze w Epidemiologii zawodowej

. 2.edn.

Nowy Jork

2004

Hernan

Hernandez-Diaz

Robins

a structural approach to selection bias

Epidemiologia

2004

;

615

–

Grenlandia

ilościowe odchylenia w modelach przyczynowych: Klasyczne odchylenie zakłócające vs Zderzacz-stratyfikacja

Epidemiologia

2003

;

300

–

Glymour

Grenlandia

diagramy Przyczynowe

. W:

Grenlandia

Lash

(eds).

Współczesna Epidemiologia

. 3.edn.

Philadelphia, PA

Lippincott Williams & Wilkins

2008

Pizzi

De Stavola

Merletti

i in. .

dobór próby i ważność szacunków związku narażenia-choroby w badaniach kohortowych

J Epidemiol Community Health

2011

;

407

–

Westreich

błąd Berksona, błąd wyboru i brakujące dane

Epidemiologia

2012

;

159

–

Grenlandia

bayesowskie perspektywy badań epidemiologicznych. III. Analiza biasu za pomocą metod braku danych

Int J Epidemiol

2010

;

1116

–

błąd Berksona

kierowane wykresy acykliczne (dag)

składniki błędu berksona

siła i kierunek odchylenia

finansowanie

podziękowania

You might also like

Thyrogen

Google Moja Firma Aktualizacja: Dodaj więcej godzin dla konkretnych usług

Dodaj komentarz Anuluj pisanie odpowiedzi