kommentar: tre verdener kolliderer: Berksons bias, selection bias og collider bias

Berksons bias

i 1984 boede en af os (N. P.) på stranden i Danmark. Jeg skrev min ph. d. – afhandling, da jeg havde en fodboldskade, som gav mig et alvorligt rygproblem i en uge. Efter de første to dage med at ligge rundt på ryggen og lytte til musik og ikke kunne gøre meget andet, vågnede jeg midt om natten med kvalme og svimmelhed tilsyneladende forårsaget af en indre øreinfektion. I de næste fem dage havde jeg alvorlige rygsmerter, da jeg rejste mig, svær kvalme og svimmelhed, når jeg lagde mig, og en blanding af de to, da jeg sad i en stol. Formålet med at fortælle denne triste historie er ikke at relatere min medicinske historie til læsere af ije, men snarere fordi det er relevant for historien om Berksons bias, som jeg havde studeret på det tidspunkt. Jeg blev ikke indlagt på hospitalet, men det var en nær ting, og det gav mig førstehåndsoplevelse af, hvordan ‘personer med to eller flere sygdomme har større sandsynlighed for at blive indlagt på hospitalet end personer med kun en sygdom—selvom disse resultater er uafhængige’.1 Hvis jeg var blevet indlagt på hospitalet og rekrutteret til en undersøgelse af infektioner i det indre øre, og hvis der havde været nok andre mennesker som mig, ville vi sandsynligvis have bidraget til en falsk konklusion om,at fodboldskader (som forårsagede mit rygproblem) var en årsag til infektioner i det indre øre—Dette svarer til den ‘indirekte’ form for Berksons bias, 2 som afbildet i figur 3a i papiret fra Snoep et al.1

Berksons bias (også kaldet ‘Berksons fejlslutning’) er måske en af de mest kendte, men mindst forståede former for bias. Papiret af Snoep et al.1 præciserer, hvad bias er, hvorfor det nogle gange betyder noget, men hvorfor det normalt ikke gør det. vi vil kommentere tre aspekter af papiret: (i) brugen af rettede acykliske grafer (dag ‘ er); (ii) komponenterne i Berksons bias; og (iii) den sandsynlige styrke og retning af sådanne forstyrrelser.

rettede acykliske grafer (dag ‘ er)

papiret fra Snoep et al. illustrerer tydeligt kraften og elegancen af rettede acykliske grafer (dag ‘ er). Hvad vi tidligere brugte til at forsøge at forstå ved hjælp af ord, sandsynligheder og numeriske eksempler, kan nu udforskes meget mere elegant ved hjælp af kausale diagrammer. Dette repræsenterer et reelt fremskridt og præciserer mange aspekter af Berksons bias.

mere generelt har Dag ‘ er afklaret det tidligere skumle forhold mellem selection bias og confounding. Traditionelt er selektionsbias blevet beskrevet som bias som følge af upassende udvælgelse (eller selvvalg) af forsøgspersoner fra kildepopulationen.3 på et niveau er dette klart nok, men brugen af ordet ‘udvælgelse’ har ofte ført til,at udtrykket anvendes på upassende valg af en sammenligningsgruppe,hvilket har ført til forvirring om, hvorvidt fænomener som den sunde arbejdereffekt er eksempler på selektionsforstyrrelser4 eller forvirrende, 5, 6 situationen er yderligere kompliceret, fordi determinanter for udvælgelse (f.eks. alder, køn, socioøkonomisk stilling) effektivt kan blive forvirrende og kontrolleres for i analysen, selvom de ikke var forvirrende i kildepopulationen. Brugen af dag’er præciserer dette og skelner mellem forstyrrelser som følge af (upassende) konditionering af almindelige effekter (‘collider bias ‘eller’ selection bias’) og manglende konditionering af almindelige årsager til eksponering og resultat (confounding).6,7 de to fænomener kan forekomme sammen, f.eks. når vi konditionerer på en collider, der er effekten af en årsag til resultatet snarere end at være en effekt af selve resultatet. Nogle vil mærke dette som selektionsforstyrrelse,6 andre ville betragte det som også en form for forvirring.8,9

selvom de tre udtryk undertiden bruges næsten om hverandre, er collider bias det mere generelle fænomen, der involverer konditionering af almindelige effekter (skønt Hernan et al.6 brug udtrykket ‘selection bias’ for dette mere generelle fænomen); selection bias er så en bestemt type collider bias, hvor den fælles effekt er udvælgelse i undersøgelsen; Berksons bias er derefter en bestemt type selektionsbias10, hvor udvælgelse af tilfælde i undersøgelsen afhænger af indlæggelse, og eksponeringen er en anden sygdom eller en årsag til en anden sygdom, hvilket også resulterer i indlæggelse. Det er usandsynligt, at dette ville have været så let afklaret uden brug af dag ‘ er.

komponenterne i Berksons bias

i sin blotte essens kan Berksons bias ses som et partisk skøn over oddsene for eksponering blandt tilfældene, fordi udsatte tilfælde identificeres med større sandsynlighed end ikke-eksponerede tilfælde, når indlæggelsesgraden for tilfældene er mindre end 100%, og eksponeringen er en anden sygdom eller en årsag til en anden sygdom, hvilket resulterer i indlæggelse. Det er muligt at illustrere med numeriske eksempler de forskellige trin, der er involveret i Berksons bias. Lad os starte med den befolkning, der er rapporteret i tabel 5 i Berksons paper2, hvor oddsforholdet er 1,0 (tabel 1).

tabel 1.

forening i den generelle befolkning som rapporteret i Berkson2

. udsat . ikke eksponeret . i alt .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
sager 3000 97 000 100 000
ikke-sager 297 000 9 603 000 9 900 000
i alt 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

tabel 1.

forening i den generelle befolkning som rapporteret i Berkson2

. udsat . Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
sager 3000 97 000 100 000
ikke-sager 297 000 9 603 000 9 900 000
i alt 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

vi antager nu, at undersøgelsen sammenligner indlagte tilfælde med generel befolkningskontrol (svarende til figur 1b i Snoep et al.1). Vi bruger de samme sandsynligheder for indlæggelse for sygdom 1 (eksponeringen—0,15) og sygdom 2 (sagerne—0,05) af Berksons papir. Vi antager også (forskelligt fra Berkson2 og fra Snoep et al.1) at hele befolkningen har en prævalens på 0,2 og en hospitaliseringsrate på 0,025 for enhver anden sygdom end D1 og D2 (disse forskellige antagelser betyder, at vores tal er lidt forskellige fra Berkson2 og Snoep et al.1). Hvis undersøgelsen sammenligner indlagte tilfælde med generel befolkningskontrol udtaget fra ikke-tilfælde med en prøveudtagningsfraktion på 10%, er de tilsvarende fund vist i tabel 2. Det estimerede oddsforhold er nu 3,59 på grund af højere eksponeringsodds i de indlagte tilfælde (sammenlignet med alle tilfælde). Dette er forårsaget af collider bias som vist i figur 1b i Snoep et al.1

tabel 2.

forening ved hjælp af indlagte sager og generel befolkningskontrol

. udsat . ikke eksponeret . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
sager 590 5311 5901
kontrol 29 700 960 300 990 000
i alt 30 290 965 611 995 901

Odds ratio = 3.59.

tabel 2.

forening ved hjælp af indlagte sager og generel befolkningskontrol

. udsat . Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
sager 590 5311 5901
kontrol 29 700 960 300 990 000
i alt 30 290 965 611 995 901

Odds ratio = 3.59.

de tilsvarende fund fra en undersøgelse udført blandt indlagte patienter i samme population er vist i tabel 3. Bias er nu i den modsatte retning, fordi stigningen i eksponeringsodds i tilfældene (sammenlignet med alle tilfælde) mere end opvejes af en endnu større stigning i eksponeringsodds i ikke-tilfælde (sammenlignet med den generelle befolkning). Dette er igen forårsaget af collider bias, som afbildet i figur 1a i Snoep et al.1

tabel 3.

forening ved hjælp af indlagte tilfælde og kontroller fra patienter indlagt for enhver sygdom med en 0,2 populationsprævalens og en 0.025 Sandsynlighed for indlæggelse for enhver anden sygdom end D1 (eksponering) eller D2 (tilfælde)

. udsat . ikke eksponeret . i alt .
Sager 590 5311 5901
Kontrol 45 812 48 015 93 827
I Alt 46 402 53 326 99 728
. udsat . ikke eksponeret . i alt .
sager 590 5311 5901
kontrol 45 812 48 015 93 827
i alt 46 402 53 326 99 728

Odds ratio = 0.12.

tabel 3.

forening ved hjælp af indlagte tilfælde og kontroller fra patienter indlagt for enhver sygdom med en 0.2 populationsprævalens og en 0,025 Sandsynlighed for indlæggelse for enhver anden sygdom end D1 (eksponering) eller D2 (tilfælde)

. udsat . ikke eksponeret . i alt .
Sager 590 5311 5901
Kontrol 45 812 48 015 93 827
I Alt 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

Tabel 4 viser et eksempel,der mere ligner det for Berkson, 2 hvor en bestemt sygdom er valgt til udvælgelse af kontroller, og kontrolsygdommen har en 0,20 Sandsynlighed for indlæggelse og en prævalens på 0,005; oddsforholdet er nu 2,26, og bias er nu i den modsatte retning af tabel 3, fordi indlæggelsesgraden for kontrolsygdommen er større end indlæggelsesgraden for sagen sygdom (og derfor er stigningen i eksponeringen større i tilfældene end i kontrollerne).

Tabel 4.

forening ved hjælp af kontroller indlagt med en bestemt sygdom med en 0,005 populationsprævalens og en 0,20 Sandsynlighed for indlæggelse for kontrolsygdommen

. udsat . ikke eksponeret . i alt .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
sager 590 5311 5901
kontrol 480 9757 10 237
i alt 1070 15 068 16 138

Odds ratio = 2.26.

Tabel 4.

forening ved hjælp af kontroller indlagt med en bestemt sygdom med en 0,005 befolkningsudbredelse og en 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
sager 590 5311 5901
kontrol 480 9757 10 237
i alt 1070 15 068 16 138

Odds ratio = 2.26.

når man bruger generel befolkningskontrol, vil Berksons bias således have en tendens til at producere forhøjede oddsforhold (når indlæggelsesgraden for sagen sygdom er mindre end 100%); når du bruger hospitalskontroller, kan bias være i begge retninger.

styrken og retningen af bias

papiret af Snoep et al. ikke kun præciserer disse underliggende mekanismer for Berksons bias; det giver også skøn over dets styrke og retning under forskellige omstændigheder (se Snoep et al., Tabel 31). Dette afslører, at når Berkson konstruerede et scenarie svarende til Tabel 4, hvor antallet af indlæggelse i kontrolsygdommen (brydningsfejl) var betydelig højere end i tilfældet sygdom (diabetes)-0,2 sammenlignet med 0.05-oddsforholdene var stærkt forudindtaget opad (linje 1 i Snoep et al., tabel 31); når antallet af indlæggelse er lavere i kontrolsygdommen, er oddsforholdet partisk nedad (linjer 4-5 i tabel 3 i Snoep et al.1), mens der ikke er nogen bias, når indlæggelsesgraden er den samme for de to sygdomme, og patienter, der har både sagen og kontrolsygdommen, tælles kun som tilfælde (linje 8-9, tabel 3 i Snoep et al.1).

så Berksons bias kan helt sikkert forekomme, men betyder det virkelig noget? Som Snoep et al.1 Bemærk, Berksons eksempel var baseret på en hypotetisk undersøgelse, der involverede sammenhængen mellem fremherskende tilfælde og en anden udbredt sygdom (eksponeringen). Når eksponering ikke er en direkte grund til indlæggelse i sig selv, er kun den indirekte form for Berksons bias relevant—som eksemplet om rygproblemet forårsaget af en fodboldskade (se ovenfor). Denne bias dæmpes stort set ved hjælp af hændelsessager og kan forhindres fuldstændigt ved at udelukke tilfælde, der blev indlagt på grund af en anden sygdom. Dette kan ses af eksemplet beskrevet ovenfor – mange mennesker med hændende mellemøreinfektioner skulle indlægges på hospitalet for samtidige fodboldskader for at der kan forekomme materiel bias. I mange (eller måske mest) plausible situationer vil bias således være ekstremt lille, især hvis der anvendes hændelsessager. Selvom det er teoretisk interessant, har det i praksis stort set været ‘meget ado om ingenting’.

måske er hovedbudskabet her, at det ikke er tilstrækkeligt blot at demonstrere, at en bias kan forekomme; det er også nødvendigt at vurdere sandsynligheden for, at det vil forekomme, og dets sandsynlige styrke og retning. Epidemiologiske undersøgelser kritiseres ofte på baggrund af potentialet for informationsforstyrrelse eller resterende forvirring. I nogle tilfælde er disse potentielle problemer reelle og vigtige; i andre er de trivielle. Bayesiske metoder bliver mere og mere tilgængelige for at vurdere den sandsynlige styrke og retning af sådanne forstyrrelser.11

hvilket bringer os til begrænsningerne af dag ‘ er. Berksons papir gav ekstreme resultater, fordi det var baseret på fremherskende sager, en situation, der ikke let kan repræsenteres af dag ‘ er. Hvis vi skifter fra fremherskende sager til hændelsessager, Alle dag ‘ er i figur 1-6 i Snoep et al.1 ser stadig det samme ud, men forspændingerne er generelt blevet trivielle. Dette illustrerer et mere generelt problem med dag—er-de kan vise, at en bias kan forekomme, men giver ikke skøn over dens sandsynlige styrke og retning. Uden dette er det let at bukke under for ‘analyselammelse’, der stammer fra frygt for at justere for en potentiel forvirrer (som også kan være en collider i en anden vej), fordi det kan resultere i collider bias (‘collider angst’). I nogle situationer kan collider bias være sammenlignelig i størrelse med ukontrolleret forvirring.7 i andre vil det ikke, og fordelen ved at kontrollere confounding vil langt opveje virkningerne af collider bias. Det hele afhænger.

finansiering

Center for folkesundhedsforskning støttes af et Programstipendium fra Sundhedsforskningsrådet.

anerkendelser

vi takker Jan Vandenbroucke for hans kommentarer til udkastet til manuskript.

interessekonflikt: ingen erklæret.

1

Snoep
JD

Morabia
A

Herregud
S

Hernan
MA

Vandenbroucke
JP

.

en strukturel tilgang til Berksons fejlslutning: og en guide til en historie med meninger om det

.

Int J Epidemiol
2014

;

43

:

515

21

.

2

Berkson
J

.

begrænsninger af anvendelsen af firefoldig tabelanalyse på hospitalsdata

.

Biometri Bull
1946

;

2

:

47

53

.

Genoptrykt Int J Epidemiol 2014;; 43: 511-15.

3

Rothman
KJ

Grønland
S

Lash
TL

.

gyldighed i epidemiologiske studier

. I:

Rothman
KJ

Grønland
S

Lash
TL

(eds).

Moderne Epidemiologi

. 3. udgave.

Philadelphia, PA

:

Lippincott Vilhelm &

,

2008

.

4

Kontrolmåde
H

Pearce
N

Brun
D

.

forskningsmetoder i erhvervsmæssig Epidemiologi

.

København

:

Københavns Universitet

,

1989

.

5

Kontrolmåde
H

Pearce
N

Kriebel
D

.

forskningsmetoder i erhvervsmæssig Epidemiologi

. 2. udgave.

København

:

Københavns Universitet

,

2004

.

6

Hernan
MA

Herregud
S

Robins
JM

.

en strukturel tilgang til selektionsbias

.

Epidemiologi
2004

;

15

:

615

25

.

7

Grønland
S

.

kvantificering af forstyrrelser i kausale modeller: klassisk confounding vs collider-stratification bias

.

Epidemiologi
2003

;

14

:

300

06

.

8

Glymour
MM

Grønland
S

.

kausal diagrammer

. I:

Rothman
KJ

Grønland
S

Lash
TL

(eds).

Moderne Epidemiologi

. 3. udgave.

Philadelphia, PA

:

Lippincott Vilhelm &

,

2008

.

9

med
C

de Stavola
B

Merletti
F

et al. .

Prøveudvælgelse og gyldighed af estimater for eksponering-sygdomssammenslutning i kohortestudier

.

J Epidemiol Samfund Sundhed
2011

;

65

:

407

11

.

10

Vestreich
D

.

Berksons bias, selection bias og manglende data

.

Epidemiologi
2012

;

23

:

159

64

.

11

Grønland
S

.

Bayesian perspektiver for Epidemiologisk forskning. III. Bias analyse via manglende data metoder

.

Int J Epidemiol
2010

;

39

:

1116

16

.

You might also like

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.