komentarz: zderzają się trzy światy: błąd berksona, błąd selekcji i błąd Zderzacza

błąd Berksona

w 1984 roku jeden z nas (N. P.) mieszkał na plaży w Nowej Zelandii. Pisałem pracę doktorską, kiedy miałem kontuzję piłki nożnej („piłka nożna”), która dała mi poważny problem z plecami przez tydzień. Po pierwszych dwóch dniach leżenia na plecach słuchając muzyki i nie będąc w stanie zrobić wiele innego, obudziłem się w środku nocy z nudnościami i zawrotami głowy najwyraźniej spowodowanymi infekcją ucha wewnętrznego. Przez następne pięć dni miałem silny ból pleców, gdy wstałem, silne nudności i zawroty głowy, gdy kładę się i mieszaninę tych dwóch, gdy siedziałem na krześle. Celem opowiedzenia tej żałosnej historii nie jest odniesienie mojej historii medycznej do czytelników IJE, ale raczej dlatego, że jest ona istotna dla historii stronniczości Berksona, którą studiowałem w tym czasie. Nie zostałem przyjęty do szpitala, ale to było bliskie i dało mi to doświadczenie z pierwszej ręki, w jaki sposób „osoby z dwiema lub więcej chorobami mają większe prawdopodobieństwo hospitalizacji niż osoby z jedną chorobą-nawet jeśli te wyniki są niezależne”.1 gdybym był hospitalizowany i zrekrutowany do badania infekcji ucha wewnętrznego i gdyby było wystarczająco dużo innych osób takich jak ja, prawdopodobnie przyczynilibyśmy się do fałszywego wniosku,że kontuzje piłkarskie (które spowodowały mój problem z plecami) były przyczyną infekcji ucha wewnętrznego—odpowiada to „pośredniej” formie błędu Berksona, 2 Jak przedstawiono na rysunku 3a w artykule Snoep et al.1

stronniczość Berksona (zwana także „błędem Berksona”) jest prawdopodobnie jedną z najbardziej znanych, ale najmniej zrozumiałych form stronniczości. Artykuł Snoep et al.1 wyjaśnia, czym jest błąd, dlaczego czasami ma znaczenie, ale dlaczego zwykle nie. skomentujemy trzy aspekty artykułu: (i) użycie ukierunkowanych grafów acyklicznych (dag); (ii) składniki błędu berksona; oraz (iii) prawdopodobną siłę i kierunek takich błędów.

kierowane wykresy acykliczne (dag)

artykuł Snoep et al. wyraźnie ilustruje siłę i elegancję skierowanych grafów acyklicznych (dag). To, co wcześniej staraliśmy się zrozumieć za pomocą słów, prawdopodobieństw i przykładów numerycznych, można teraz zgłębiać o wiele bardziej elegancko za pomocą diagramów przyczynowych. Stanowi to prawdziwy postęp i wyjaśnia wiele aspektów uprzedzeń Berksona.

bardziej ogólnie, dag wyjaśniły wcześniej mętną zależność między błędem wyboru a błędem. Tradycyjnie, błąd selekcji został opisany jako błąd wynikający z niewłaściwej selekcji (lub selekcji własnej) badanych z populacji źródłowej.3 na jednym poziomie jest to wystarczająco jasne, ale użycie słowa „selekcja” często prowadzi do tego,że termin ten jest stosowany do niewłaściwego doboru grupy porównawczej,co prowadzi do dezorientacji co do tego, czy zjawiska takie jak efekt zdrowego pracownika są przykładami bias selekcji4 lub mylące, 5, 6 sytuacja jest bardziej skomplikowana, ponieważ determinanty selekcji (np. wiek, płeć, pozycja społeczno-ekonomiczna) mogą skutecznie stać się czynnikami zakłócającymi i być kontrolowane w analizie, nawet jeśli nie były czynnikami zakłócającymi w populacji źródłowej. Stosowanie dag wyjaśnia to i rozróżnia między uprzedzeniami wynikającymi z (niewłaściwego) uwarunkowania powszechnymi skutkami („stronniczość Zderzacza” lub „stronniczość selekcji”) a brakiem uwarunkowań typowych przyczyn narażenia i wyniku (zakłócanie).6,7 te dwa zjawiska mogą wystąpić razem, np. gdy stan Zderzacza jest skutkiem przyczyny wyniku, a nie skutkiem samego wyniku. Niektórzy określiliby to jako błąd wyboru, a 6 innych uznałoby to za rodzaj zamieszania.8,9

tak więc, chociaż te trzy terminy są czasami używane prawie zamiennie, tendencja Zderzacza jest bardziej ogólnym zjawiskiem obejmującym uwarunkowanie powszechnymi skutkami (chociaż Hernan i in.6 używać terminu „błąd selekcji” dla tego bardziej ogólnego zjawiska); błąd selekcji jest wtedy szczególnym rodzajem błędu Zderzacza, w którym wspólnym efektem jest wybór do badania; Stronniczość berksona jest wtedy szczególnym rodzajem selekcji bias10, w którym wybór przypadków do badania zależy od hospitalizacji, a ekspozycja jest inną chorobą lub przyczyną innej choroby, która również skutkuje hospitalizacją. Jest mało prawdopodobne, aby można było to tak łatwo wyjaśnić bez użycia dag.

składniki błędu berksona

w swojej istocie błąd Berksona można postrzegać jako stronnicze oszacowanie szans na ekspozycję wśród przypadków, ponieważ narażone przypadki są identyfikowane z większym prawdopodobieństwem niż przypadki nieeksponowane, gdy wskaźnik hospitalizacji dla tych przypadków jest mniejszy niż 100%, a ekspozycja jest inną chorobą lub przyczyną innej choroby, która powoduje hospitalizację. Możliwe jest zilustrowanie za pomocą przykładów numerycznych różnych kroków zaangażowanych w stronniczość Berksona. Zacznijmy od populacji przedstawionej w tabeli 5 w artykule Berksona2, gdzie iloraz szans wynosi 1,0 (Tabela 1).

Tabela 1.

Stowarzyszenie w populacji ogólnej według raportu Berkson2

.
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
przypadki 3000 97 000 100 000
bez przypadków 297 000 9 603 000 9 900 000
razem 300 000 9 700 000 10 000 000

iloraz szans = 1,0.

Tabela 1.

Stowarzyszenie w populacji ogólnej według raportu Berkson2

. Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
przypadki 3000 97 000 100 000
bez przypadków 297 000 9 603 000 9 900 000
razem 300 000 9 700 000 10 000 000

iloraz szans = 1,0.

Zakładamy teraz, że badanie porównuje hospitalizowane przypadki z ogólnymi kontrolami populacji(co odpowiada Fig. 1B Snoep et al.1). Stosujemy te same prawdopodobieństwa hospitalizacji dla choroby 1 (ekspozycja—0,15) i choroby 2 (przypadki—0,05) z artykułu Berksona. Zakładamy również (inaczej niż Berkson2 i Snoep et al.1) że cała populacja ma częstość występowania 0,2 i wskaźnik hospitalizacji 0,025 dla każdej innej choroby niż D1 i D2 (te różne założenia oznaczają, że nasze liczby są nieco inne od tych z Berkson2 i Snoep et al.1). Jeśli w badaniu porównano przypadki hospitalizowane z ogólnymi kontrolami populacji pobranymi z przypadków innych niż przypadki z ułamkiem próbkowania wynoszącym 10%, odpowiednie wyniki przedstawiono w tabeli 2. Szacowany współczynnik szans wynosi obecnie 3,59, ze względu na wyższe kursy ekspozycji w przypadkach hospitalizowanych (w porównaniu ze wszystkimi przypadkami). Jest to spowodowane przez odchylenie Zderzacza, jak pokazano na fig. 1B Snoep et al.1

Tabela 2.

Stowarzyszenie wykorzystujące przypadki hospitalizacji i ogólną kontrolę populacji

. Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
przypadki 590 5311 5901
kontrole 29 700 960 300 990 000
razem 30 290 965 611 995 901

iloraz szans = 3,59.

Tabela 2.

Stowarzyszenie wykorzystujące przypadki hospitalizacji i ogólną kontrolę populacji

. Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
przypadki 590 5311 5901
kontrole 29 700 960 300 990 000
razem 30 290 965 611 995 901

iloraz szans = 3,59.

odpowiednie wyniki badań przeprowadzonych wśród pacjentów hospitalizowanych w tej samej populacji przedstawiono w tabeli 3. Tendencja jest teraz w przeciwnym kierunku, ponieważ wzrost kursów ekspozycji w przypadkach (w porównaniu ze wszystkimi przypadkami) jest bardziej niż równoważony przez jeszcze większy wzrost kursów ekspozycji w przypadkach innych niż przypadki (w porównaniu z ogólną populacją). Jest to ponownie spowodowane przez odchylenie Zderzacza, jak pokazano na fig. 1a Snoep et al.1

Tabela 3.

Stowarzyszenie wykorzystujące hospitalizowane przypadki i kontrole pacjentów hospitalizowanych z powodu jakiejkolwiek choroby, z częstością występowania 0,2 populacji i 0.025 prawdopodobieństwo hospitalizacji z powodu choroby innej niż D1 (ekspozycja) lub D2 (przypadki)

.
Przypadki 590 5311 5901
Kontrole 45 812 48 015 93 827
Razem 46 402 53 326 99 728
.
przypadki 590 5311 5901
kontrole 45 812 48 015 93 827
razem 46 402 53 326 99 728

iloraz szans = 0,12.

Tabela 3.

Stowarzyszenie za pomocą hospitalizowanych przypadków i kontroli od pacjentów hospitalizowanych z powodu każdej choroby, z 0.2 częstość występowania populacji i 0,025 prawdopodobieństwo hospitalizacji z powodu jakiejkolwiek choroby innej niż D1 (ekspozycja) lub D2 (przypadki)

.
Przypadki 590 5311 5901
Kontrole 45 812 48 015 93 827
Razem 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

Tabela 4 pokazuje przykład bardziej podobny do Berksona, 2, w którym jedna konkretna choroba została wybrana do wyboru grupy kontrolnej i choroba kontrolna ma prawdopodobieństwo hospitalizacji 0,20 i częstość występowania 0,005; współczynnik szans wynosi teraz 2,26, a odchylenie jest teraz w przeciwnym kierunku do Tabeli 3, ponieważ wskaźnik hospitalizacji w przypadku choroby kontrolnej jest większy niż wskaźnik hospitalizacji w przypadku choroby (a zatem wzrost ekspozycji jest większy w przypadkach niż w grupach kontrolnych).

Tabela 4.

skojarzenie z kontrolami hospitalizowanymi z konkretną chorobą, z częstością występowania populacji 0,005 i prawdopodobieństwem 0,20 hospitalizacji z powodu choroby kontrolnej

.
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
przypadki 590 5311 5901
kontrole 480 9757 10 237
razem 1070 15 068 16 138

iloraz szans = 2,26.

Tabela 4.

Asocjacja z wykorzystaniem kontroli hospitalizowanych z konkretną chorobą, z częstością występowania w populacji 0, 005 i 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
przypadki 590 5311 5901
kontrole 480 9757 10 237
razem 1070 15 068 16 138

iloraz szans = 2,26.

Tak więc, podczas korzystania z ogólnej kontroli populacji, błąd Berksona będzie miał tendencję do generowania podwyższonych współczynników szans (gdy wskaźnik hospitalizacji dla choroby przypadku jest mniejszy niż 100%); podczas korzystania z kontroli szpitalnych odchylenie może być w dowolnym kierunku.

siła i kierunek odchylenia

artykuł Snoep et al. nie tylko wyjaśnia te podstawowe mechanizmy stronniczości Berksona; zapewnia również szacunki jego siły i kierunku w różnych okolicznościach(patrz Snoep et al., Tabela 31). Pokazuje to, że gdy Berkson skonstruował scenariusz podobny do Tabeli 4, w którym wskaźnik hospitalizacji w chorobie kontrolnej (błędy refrakcji) był znacznie wyższy niż w przypadku choroby (cukrzyca)-0,2 w porównaniu z 0.05-współczynniki kursów były silnie tendencyjne w górę (linia 1 Snoep et al., tabela 31); gdy wskaźnik hospitalizacji jest niższy w chorobie kontrolnej, stosunek szans jest tendencyjny w dół(linie 4-5 W Tabeli 3 Snoep et al.1), podczas gdy nie ma stronniczości, gdy wskaźnik hospitalizacji jest taki sam dla obu chorób, a pacjenci, którzy mają zarówno przypadek, jak i chorobę kontrolną, są liczeni tylko jako przypadki (linie 8-9, Tabela 3 Snoep et al.1).

więc stronniczość Berksona z pewnością może wystąpić, ale czy to naprawdę ma znaczenie? Jak Snoep et al.1 Uwaga, przykład Berksona został oparty na hipotetycznym badaniu obejmującym związek między powszechnymi przypadkami a inną powszechną chorobą (ekspozycją). Gdy ekspozycja nie jest bezpośrednią przyczyną hospitalizacji, istotna jest tylko pośrednia forma uprzedzenia Berksona-jak przykład o problemie pleców spowodowanym kontuzją piłki nożnej (patrz wyżej). Stronniczość ta jest w dużej mierze osłabiona przez zastosowanie przypadków incydentalnych i można jej całkowicie zapobiec, wykluczając przypadki, które były hospitalizowane z powodu innej choroby. Widać to na przykładzie opisanym powyżej—Wiele osób z incydentalnymi infekcjami ucha środkowego musiałoby być hospitalizowanych z powodu równoczesnych urazów piłkarskich, aby wystąpić odchylenie materialne. W związku z tym w wielu (lub być może większości) prawdopodobnych sytuacjach odchylenie będzie bardzo małe, szczególnie w przypadku przypadków incydentalnych. Chociaż jest to teoretycznie interesujące, w praktyce w dużej mierze było to „wiele hałasu o nic”.

być może głównym przesłaniem jest to, że nie wystarczy jedynie wykazać, że błąd może wystąpić; konieczne jest również oszacowanie prawdopodobieństwa, że nastąpi, a także jego prawdopodobnej siły i kierunku. Badania epidemiologiczne są często krytykowane ze względu na potencjalne odchylenie od informacji lub szczątkowe pomieszanie. W niektórych przypadkach te potencjalne problemy są realne i ważne, w innych są trywialne. Metody bayesowskie stają się coraz bardziej dostępne do oceny prawdopodobnej siły i kierunku takich uprzedzeń.11

co prowadzi nas do ograniczeń dag. Praca berksona przyniosła ekstremalne wyniki, ponieważ opierała się na powszechnych przypadkach, sytuacji, której nie można łatwo przedstawić przez dag. Jeśli zmienimy z częstych przypadków na przypadki incydentów, wszystkie dag na rysunkach 1-6 w Snoep et al.1 nadal wyglądają tak samo, ale uprzedzenia na ogół stały się banalne. Ilustruje to bardziej ogólny problem dag – mogą one pokazać, że błąd może wystąpić, ale nie dostarczają szacunków jego prawdopodobnej siły i kierunku. Bez tego łatwo jest poddać się „paraliżowi analitycznemu”, który wynika ze strachu przed dostosowaniem się do potencjalnego Zakłócacza (który może być również zderzaczem na innej ścieżce), ponieważ może to spowodować stronniczość Zderzacza („lęk Zderzacza”). W niektórych sytuacjach odchylenie Zderzacza może być porównywalne z niekontrolowanym zakłócaniem.7 w innych nie będzie, a korzyści z kontrolowania zakłócania znacznie przewyższą skutki błędu Zderzacza. Wszystko zależy.

finansowanie

Centrum Badań nad zdrowiem publicznym jest wspierane przez Grant programowy z Health Research Council of New Zealand.

podziękowania

dziękujemy Janowi Vandenbroucke za komentarze do projektu rękopisu.

konflikt interesów: brak danych.

1

Snoep
JD

Morabia
A

Hernandez-Diaz
S

Hernan
MA

Vandenbroucke
JP

.

a structural approach to Berkson ’ s fallacy: and a guide to a history of opinions about it

.

Int J Epidemiol
2014

;

43

:

515

21

.

2

Berkson
J

.

ograniczenia zastosowania analizy tabeli czterokrotnej do danych szpitalnych

.

Byk Biometryczny
1946

;

2

:

47

53

.

3

Rothman
KJ

Grenlandia
S

Lash
TL

.

Ważność w badaniach epidemiologicznych

. W:

KJ

Grenlandia
S

Lash
TL

(eds).

Współczesna Epidemiologia

. 3.edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

4

Checkoway
H

Pearce
N

Crawford-Brown
D

.

metody badawcze w Epidemiologii zawodowej

.

Nowy Jork

:

,

1989

.

5

Checkoway
H

Pearce
N

Kriebel
D

.

metody badawcze w Epidemiologii zawodowej

. 2.edn.

Nowy Jork

:

,

2004

.

6

Hernan
MA

Hernandez-Diaz
S

Robins
JM

.

a structural approach to selection bias

.

Epidemiologia
2004

;

15

:

615

25

.

7

Grenlandia
S

.

ilościowe odchylenia w modelach przyczynowych: Klasyczne odchylenie zakłócające vs Zderzacz-stratyfikacja

.

Epidemiologia
2003

;

14

:

300

06

.

8

Glymour
MM

Grenlandia
S

.

diagramy Przyczynowe

. W:

KJ

Grenlandia
S

Lash
TL

(eds).

Współczesna Epidemiologia

. 3.edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

9

Pizzi
C

De Stavola
B

Merletti
F

i in. .

dobór próby i ważność szacunków związku narażenia-choroby w badaniach kohortowych

.

J Epidemiol Community Health
2011

;

65

:

407

11

.

10

Westreich
D

.

błąd Berksona, błąd wyboru i brakujące dane

.

Epidemiologia
2012

;

23

:

159

64

.

11

Grenlandia
S

.

bayesowskie perspektywy badań epidemiologicznych. III. Analiza biasu za pomocą metod braku danych

.

Int J Epidemiol
2010

;

39

:

1116

16

.

You might also like

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.