Kommentar: Three worlds collide: Berkson’ s bias, selection bias and collider bias

Berkson ‘ s bias

i 1984 bodde en av Oss (N. P.) på stranden I New Zealand. Jeg skrev Doktoravhandlingen min, da jeg hadde en fotballskade som ga meg et alvorlig ryggproblem i en uke. Etter de to første dagene med å ligge på ryggen og høre på musikk og ikke kunne gjøre mye annet, våknet jeg midt på natten med kvalme og svimmelhet tilsynelatende forårsaket av en indre øreinfeksjon. De neste fem dagene hadde jeg sterke ryggsmerter da jeg sto opp, alvorlig kvalme og svimmelhet da jeg la meg ned og en blanding av de to da jeg satt i en stol. Hensikten med å fortelle denne triste historien er ikke å relatere min medisinske historie til leserne AV IJE, men heller fordi den er relevant for Historien Om Berksons bias, som jeg hadde studert på den tiden. Jeg ble ikke innlagt på sykehus, men det var en nær ting, og det ga meg førstehånds erfaring med hvordan ‘personer med to eller flere sykdommer har større sannsynlighet for å bli innlagt på sykehus enn personer med bare en sykdom—selv om disse resultatene er uavhengige’.1 Hvis jeg hadde blitt innlagt på sykehus og rekruttert til en studie av indre øreinfeksjoner, og hvis det hadde vært nok andre mennesker som meg,ville vi nok ha bidratt til en falsk konklusjon om at fotballskader (som forårsaket mitt ryggproblem) var en årsak til indre øreinfeksjoner—dette tilsvarer den ‘indirekte’ formen Av Berksons skjevhet, 2 som vist I Figur 3a i Snoep et al.1

Berksons bias (også kalt ‘Berkson’ s fallacy’) er kanskje en av de mest kjente, men minst godt forstått, formene for bias. Papiret Av Snoep et al.1 klargjør hva bias er, hvorfor det noen ganger betyr noe, Men hvorfor det vanligvis ikke. Vi vil kommentere tre aspekter av papiret: (i) bruken av Rettede Asykliske Grafer (DAGs); (ii) komponentene I Berksons bias; og (iii) den sannsynlige styrken og retningen av slike forstyrrelser.

Rettet Asykliske Grafer (DAGs)

papiret Av Snoep et al. klart illustrerer kraften og elegansen Til Rettede Asykliske Grafer (DAGs). Det vi tidligere pleide å prøve å forstå ved hjelp av ord, sannsynligheter og numeriske eksempler, kan nå utforskes mye mer elegant ved hjelp av kausale diagrammer. Dette representerer et reelt fremskritt, og klargjør mange aspekter Av Berksons bias.

Mer generelt har DAGs klargjort det tidligere mørke forholdet mellom utvalgsskjevhet og confounding. Tradisjonelt har seleksjonsbias blitt beskrevet som skjevhet som følge av upassende seleksjon (eller selvvalg) av forsøkspersoner fra kildepopulasjonen.3 På ett nivå er dette klart nok, men bruken av ordet ‘seleksjon’ har ofte ført til at begrepet blir brukt på upassende utvalg av en sammenligningsgruppe, og dermed fører til forvirring om hvorvidt fenomener som healthy worker-effekten er eksempler på seleksjonsforskjeller 4 eller av confounding,5,6 situasjonen er ytterligere komplisert fordi determinanter av seleksjon (f.eks. alder, kjønn, sosioøkonomisk stilling) effektivt kan bli confounders og kontrolleres for i analysen, selv om de ikke var confounders i kildepopulasjonen. Bruken av DAGs tydeliggjør dette, og skiller mellom skjevheter som følge av (upassende) kondisjonering på vanlige effekter (‘collider bias ‘eller’ selection bias’) og mangel på kondisjonering på vanlige årsaker til eksponering og utfall (confounding).6,7 de to fenomenene kan oppstå sammen, for eksempel når vi på en kollider forutsetter at det er effekten av en årsak til utfallet i stedet for å være en effekt av utfallet selv. Noen vil merke dette som utvalg bias, 6 andre vil vurdere det å også være en type confounding.8,9

således, selv om de tre begrepene noen ganger brukes nesten om hverandre, er collider bias det mer generelle fenomenet som involverer kondisjonering på vanlige effekter (selv Om Hernan et al.6 bruk begrepet ‘seleksjonsbias’ for dette mer generelle fenomenet); seleksjonsbias er da en bestemt type collider-bias der den vanlige effekten er utvalg i studien; Berksons bias er da en bestemt type seleksjon bias10 hvor utvalg av tilfeller i studien avhenger av sykehusinnleggelse, og eksponeringen er en annen sykdom, eller en årsak til en annen sykdom, som også resulterer i sykehusinnleggelse. Det er usannsynlig at dette ville vært så lett avklart uten Bruk Av DAGs.

komponentene I Berksons bias

I sin blotte essens Kan Berksons bias ses som en partisk estimering av oddsen for eksponering blant tilfellene fordi eksponerte tilfeller identifiseres med større sannsynlighet enn ikke-eksponerte tilfeller, når sykehusinnleggelsesraten for tilfellene er mindre enn 100% og eksponeringen er en annen sykdom, eller en årsak til en annen sykdom, noe som resulterer i sykehusinnleggelse. Det er mulig å illustrere med numeriske eksempler de ulike trinnene som er involvert I Berksons bias. La oss starte med befolkningen rapportert I Tabell 5 I Berksons paper2 hvor oddsforholdet er 1,0 (Tabell 1).

Tabell 1.

Forening i den generelle befolkningen som rapportert I Berkson2

. Utsatt . Ikke Eksponert . Totalt .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Saker 3000 97 000 100 000
Ikke-tilfeller 297 000 9 603 000 9 900 000
Totalt 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

Tabell 1.

Forening i den generelle befolkningen som rapportert I Berkson2

. Utsatt . Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Saker 3000 97 000 100 000
Ikke-tilfeller 297 000 9 603 000 9 900 000
Totalt 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

Vi antar nå at studien sammenligner sykehussaker med generelle befolkningskontroller (tilsvarende Figur 1b Av Snoep et al.1). Vi bruker de samme sannsynlighetene for sykehusinnleggelse for Sykdom 1 (eksponeringen-0,15) og Sykdom 2 (tilfellene-0,05) Av Berksons papir. Vi antar også (forskjellig Fra Berkson2 og Fra Snoep et al.1) at hele befolkningen har en prevalens på 0,2 og en sykehusinnleggelsesrate på 0,025 for enhver annen sykdom Enn D1 Og D2 (disse forskjellige antagelsene betyr at tallene våre er litt forskjellige Fra Berkson2 og Snoep et al.1). Hvis studien sammenligner innlagte tilfeller med generelle populasjonskontroller samplet fra ikke-tilfeller med en prøvefraksjon på 10%, er de tilsvarende funnene vist I Tabell 2. Den estimerte odds ratio er nå 3,59, på grunn av høyere eksponering odds i sykehus tilfeller (sammenlignet med alle tilfeller). Dette skyldes collider bias som vist I Figur 1b Av Snoep et al.1

Tabell 2.

Forening ved hjelp av sykehussaker og generell befolkningskontroll

. Utsatt . Ikke Eksponert . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Saker 590 5311 5901
Kontroller 29 700 960 300 990 000
Totalt 30 290 965 611 995 901

Odds ratio = 3,59.

Tabell 2.

Forening ved hjelp av sykehussaker og generell befolkningskontroll

. Utsatt . Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Saker 590 5311 5901
Kontroller 29 700 960 300 990 000
Totalt 30 290 965 611 995 901

Odds ratio = 3,59.

tilsvarende funn fra en studie utført blant innlagte pasienter i samme populasjon er vist I Tabell 3. Skjevheten er nå i motsatt retning, fordi økningen i eksponeringsoddsene i tilfellene (sammenlignet med alle tilfeller) mer enn kompenseres av en enda større økning i eksponeringsoddsene i de ikke-tilfellene (sammenlignet med den generelle befolkningen). Dette er igjen forårsaket av collider bias, som vist I Figur 1a Av Snoep et al.1

Tabell 3.

Forening ved hjelp av innlagte tilfeller og kontroller fra pasienter innlagt på sykehus for noen sykdom, med en 0,2 populasjon prevalens og en 0.025 sannsynlighet for sykehusinnleggelse for annen sykdom Enn d1 (eksponering) eller d2 (tilfeller)

. Utsatt . Ikke Eksponert . Totalt .
Saker 590 5311 5901
Kontroller 45 812 48 015 93 827
Totalt 46 402 53 326 99 728
. Utsatt . Ikke Eksponert . Totalt .
Saker 590 5311 5901
Kontroller 45 812 48 015 93 827
Totalt 46 402 53 326 99 728

Odds ratio = 0,12.

Tabell 3.

Association bruker sykehus tilfeller og kontroller fra pasienter innlagt på sykehus for noen sykdom, med en 0.2 populasjonsprevalens og 0,025 sannsynlighet for sykehusinnleggelse for andre sykdommer enn d1 (eksponering) eller d2 (tilfeller)

. Utsatt . Ikke Eksponert . Totalt .
Saker 590 5311 5901
Kontroller 45 812 48 015 93 827
Totalt 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

Tabell 4 viser et eksempel som ligner På Berkson, 2 hvor en bestemt sykdom er valgt for valg av kontroller, og kontrollsykdommen har en 0,20 sannsynlighet for sykehusinnleggelse og en prevalens på 0,005; oddsforholdet er nå 2,26, og bias er nå i motsatt retning Til Tabell 3, fordi sykehusinnleggelsesraten for kontrollsykdommen er større enn sykehusinnleggelsesraten for sakssykdommen (og derfor er økningen i eksponeringen større i tilfellene enn i kontrollene).

Tabell 4.

Assosiasjon med kontroller innlagt på sykehus med en bestemt sykdom, med 0,005 populasjonsprevalens og 0,20 sannsynlighet for sykehusinnleggelse for kontrollsykdommen

. Utsatt . Ikke Eksponert . Totalt .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Saker 590 5311 5901
Kontroller 480 9757 10 237
Totalt 1070 15 068 16 138

Odds ratio = 2,26.

Tabell 4.

Assosiasjon med kontroller innlagt på sykehus med en bestemt sykdom, med 0,005 populasjonsprevalens og 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Saker 590 5311 5901
Kontroller 480 9757 10 237
Totalt 1070 15 068 16 138

Odds ratio = 2,26.

Når Man bruker generelle befolkningskontroller, Vil Berksons bias derfor ha en tendens til å gi forhøyede odds-forhold (når sykehusinnleggelsesraten for sakssykdommen er mindre enn 100%); ved bruk av sykehuskontroller kan bias være i begge retninger.

styrken og retningen av bias

papiret Av Snoep et al. ikke bare klargjør Disse underliggende mekanismer For Berkson skjevhet; det gir også estimater av sin styrke og retning i en rekke omstendigheter (se Snoep et al., Tabell 31). Dette viser at Når Berkson konstruerte et scenario som ligner På Tabell 4 hvor sykehusinnleggelsen i kontrollsykdommen (brytningsfeil) var betydelig høyere enn i tilfelle sykdom (diabetes)-0.2 sammenlignet med 0.05-oddsforholdene var sterkt partisk oppover (linje 1 Av Snoep et al., tabell 31); når sykehusinnleggelsen er lavere i kontrollsykdommen, er oddsforholdet forspent nedover (linje 4-5 I Tabell 3 I Snoep et al.1), mens det ikke er noen bias når sykehusinnleggelsen er den samme for de to sykdommene, og pasienter som har både saken og kontrollsykdommen, regnes bare som tilfeller (linjer 8-9, Tabell 3 I Snoep et al .1).

Så Berksons bias kan sikkert oppstå, men betyr det egentlig noe? Som Snoep et al.1 merk, Berksons eksempel var basert på en hypotetisk studie som involverte sammenhengen mellom utbredte tilfeller og en annen utbredt sykdom (eksponeringen). Når eksponering ikke er en direkte grunn til sykehusinnleggelse i seg selv, er bare den indirekte formen For Berksons bias relevant—som eksemplet om ryggproblemet forårsaket av en fotballskade (se ovenfor). Denne skjevheten dempes i stor grad ved bruk av hendelsessaker og kan forebygges fullstendig ved å ekskludere saker som ble innlagt på sykehus på grunn av en annen sykdom. Dette kan ses fra eksemplet som er beskrevet ovenfor—mange mennesker med hendelsesinfeksjoner i mellomøret må bli innlagt på sykehus for samtidige fotballskader for at det skal oppstå materiell skjevhet. I mange (eller kanskje de fleste) troverdige situasjoner vil derfor biaset være ekstremt lite, spesielt hvis hendelsessaker brukes. Selv om det er teoretisk interessant, i praksis har det i stor grad vært ‘mye ståhei for ingenting’.

kanskje hovedbudskapet her er at det ikke er tilstrekkelig bare å demonstrere at en skjevhet kan oppstå; det er også nødvendig å vurdere sannsynligheten for at det vil skje, og dens sannsynlige styrke og retning. Epidemiologiske studier er ofte kritisert på grunnlag av potensialet for informasjon skjevhet eller rest confounding. I noen tilfeller er disse potensielle problemene reelle og viktige; i andre er de trivielle. Bayesianske metoder blir stadig mer tilgjengelige for å vurdere den sannsynlige styrken og retningen av slike forstyrrelser.11

som bringer oss til begrensningene I DAGs. Berksons papir ga ekstreme resultater fordi det var basert på utbredte tilfeller, en situasjon Som Ikke lett kan representeres av DAGs. Hvis vi bytter fra utbredte tilfeller til hendelsessaker, er alle DAGs i tallene 1-6 i Snoep et al.1 fortsatt ser det samme, men skjevhetene har generelt blitt trivielle. Dette illustrerer et mer generelt Problem Med DAGs – de kan vise at en bias kan oppstå—men gir ikke estimater av sin sannsynlige styrke og retning. Uten dette er det lett å bukke under for ‘analyse lammelse’ som stammer fra frykten for å justere for en potensiell confounder (som også kan være en collider i en annen bane) fordi å gjøre det kan resultere i collider bias (‘collider angst’). I noen situasjoner kan collider bias være sammenlignbar i størrelse med ukontrollert confounding.7 i andre vil det ikke, og fordelen av å kontrollere confounding vil langt oppveie effekten av collider bias. Alt avhenger av det.

Finansiering

Senter For Folkehelseforskning er støttet av Et Programstipend Fra Helseforskningsrådet På New Zealand.

Takk

Vi takker Jan Vandenbroucke for hans kommentarer til utkastet til manuskriptet.

Interessekonflikt: ingen erklært.

1

Snoep
JD

Morabia
A

Hernandez-Diaz
S

Hernan
MA

Vandenbroucke
JP

.

en strukturell tilnærming til Berksons feilslutning: og en guide til en historie om meninger om det

.

Int J Epidemiol
2014

;

43

:

515

21

.

2

Berkson
J

.

Begrensninger av anvendelsen av firefold tabellanalyse til sykehusdata

.

Biometri Bull
1946

;

2

:

47

53

.

Gjengitt I J Epidemiol 2014;; 43:511-15.

3

Rothman
KJ

Grønland
S

Lash
TL

.

Validitet i epidemiologiske studier

. En:

Rothman
KJ

Grønland
S

Lash
TL

(eds).

Moderne Epidemiologi

. 3. edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

4

Checkoway
H

Pearce
N

Crawford-Brun
D

.

Forskningsmetoder I Yrkesepidemiologi

.

New York

:

Oxford University Press

,

1989

.

5

Checkoway
H

Pearce
N

Kriebel
D

.

Forskningsmetoder I Yrkesepidemiologi

. 2. edn.

New York

:

Oxford University Press

,

2004

.

6

Hernan
MA

Hernandez-Diaz
S

Robins
JM

.

en strukturell tilnærming til seleksjonsbias

.

Epidemiologi
2004

;

15

:

615

25

.

7

Grønland
S

.

Kvantifisere skjevheter i kausale modeller: Klassisk confounding vs collider-stratifisering skjevhet

.

Epidemiologi
2003

;

14

:

300

06

.

8

Glymour
MM

Grønland
S

.

Årsaksdiagrammer

. En:

Rothman
KJ

Grønland
S

Lash
TL

(eds).

Moderne Epidemiologi

. 3. edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

9

Pizzi
C

De Stavola
B

Merletti
F

et al. .

utvalgsvalg og validitet av eksponeringssykdomsforeningsestimater i kohortstudier

.

J Epidemiol Samfunnet Helse
2011

;

65

:

407

11

.

10

Westreich
D

.

Berksons skjevhet, utvalgsskjevhet og manglende data

.

Epidemiologi
2012

;

23

:

159

64

.

11

Grønland
S

.

Bayesianske perspektiver for epidemiologisk forskning. III. Bias analyse via manglende data metoder

.

Int J Epidemiol
2010

;

39

:

1116

16

.

You might also like

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.