kommentar: tre världar kolliderar: Berksons bias, selection bias och collider bias

Berksons bias

1984 bodde en av oss (NP) på stranden i Nya Zeeland. Jag skrev min doktorsavhandling, när jag hade en fotboll (’fotboll’) skada som gav mig ett allvarligt ryggproblem i en vecka. Efter de första två dagarna av att ligga på ryggen och lyssna på musik och inte kunna göra mycket annat vaknade jag mitt på natten med illamående och yrsel som uppenbarligen orsakades av en inre öroninfektion. Under de kommande fem dagarna hade jag svår ryggsmärta när jag stod upp, svår illamående och yrsel när jag låg och en blandning av de två när jag satt i en stol. Syftet med att berätta om denna ledsna historia är inte att relatera min medicinska historia till läsare av IJE, utan snarare för att den är relevant för historien om Berksons bias, som jag hade studerat vid den tiden. Jag fick inte in på sjukhus, men det var en nära sak, och det gav mig förstahandserfarenhet av hur ’personer med två eller flera sjukdomar har en högre sannolikhet att läggas in på sjukhus än personer med endast en sjukdom—även om dessa resultat är oberoende’.1 Om jag hade varit på sjukhus och rekryterats för en studie av innerörat infektioner, och om det hade varit tillräckligt andra människor som mig, då vi förmodligen skulle ha bidragit till en falsk slutsats att fotboll skador (som orsakade min rygg problem) var en orsak till innerörat infektioner—detta motsvarar den ’indirekta’ form av Berksons partiskhet,2 som avbildas i figur 3a i tidningen Snoep et al.1

Berksons bias (även kallad ’Berksons fallacy’) är kanske en av de mest kända, men minst väl förstådda formerna av bias. Tidningen av Snoep et al.1 klargör vad bias är, varför det ibland betyder något, men varför det vanligtvis inte gör det.vi kommer att kommentera tre aspekter av papperet: (i) användningen av riktade acykliska grafer (dag); (ii) komponenterna i Berksons bias; och (iii) den troliga styrkan och riktningen för sådana fördomar.

riktade acykliska grafer (dag)

papperet av Snoep et al. illustrerar tydligt kraften och elegansen hos riktade acykliska grafer (dag). Vad vi tidigare använde för att försöka förstå med hjälp av ord, sannolikheter och numeriska exempel kan nu utforskas mycket mer elegant med kausaldiagram. Detta representerar ett verkligt framsteg och klargör många aspekter av Berksons bias.

mer allmänt har dag klargjort det tidigare skumma förhållandet mellan urvalsförskjutning och förvirring. Traditionellt har selektionsbias beskrivits som bias som härrör från olämpligt urval (eller självval) av studieämnen från källpopulationen.3 på en nivå är detta tillräckligt tydligt, men användningen av ordet ’urval’ har ofta lett till att termen tillämpas på olämpligt urval av en jämförelsegrupp,vilket leder till förvirring om fenomen som den friska arbetstagareffekten är exempel på urvalsförskjutning4 eller förvirrande,5, 6 situationen är ytterligare komplicerad eftersom determinanter för urval (t.ex. Ålder, kön, socioekonomisk ställning) effektivt kan bli förvirrare och kontrolleras för i analysen, även om de inte var förvirrare i källpopulationen. Användningen av DAGs klargör detta och skiljer mellan fördomar till följd av (olämplig) konditionering av vanliga effekter (’collider bias’ eller ’selection bias’) och brist på konditionering av vanliga orsaker till exponering och resultat (förvirrande).6,7 de två fenomenen kan förekomma tillsammans, t.ex. när vi villkorar en kolliderare som är effekten av en orsak till resultatet snarare än att vara en effekt av själva resultatet. Vissa skulle märka detta som urvalsförskjutning, 6 andra skulle betrakta det som en typ av förvirring.8,9

även om de tre termerna ibland används nästan omväxlande, är collider bias det mer allmänna fenomenet som involverar konditionering av vanliga effekter (även om Hernan et al.6 använd termen ’selection bias’ för detta mer allmänna fenomen); selection bias är då en viss typ av collider bias där den vanliga effekten är urval i studien; Berksons bias är då en viss typ av urvalsbias10 där urval av fall i studien beror på sjukhusvistelse, och exponeringen är en annan sjukdom eller en orsak till en annan sjukdom, vilket också resulterar i sjukhusvistelse. Det är osannolikt att detta skulle ha blivit så lätt förtydligat utan att använda DAGs.

komponenterna i Berksons bias

i sin nakna väsen kan Berksons bias ses som en partisk uppskattning av oddsen för exponering bland fallen eftersom exponerade fall identifieras med större sannolikhet än icke-exponerade fall, när sjukhusvistelsen för fallen är mindre än 100% och exponeringen är en annan sjukdom, eller en orsak till en annan sjukdom, vilket resulterar i sjukhusvistelse. Det är möjligt att med numeriska exempel illustrera de olika stegen som är involverade i Berksons bias. Låt oss börja med den population som redovisas i Tabell 5 i Berksons paper2 där oddsförhållandet är 1,0 (Tabell 1).

Tabell 1.

förening i den allmänna befolkningen som rapporterats i Berkson2

. exponerad . oexponerad . totalt .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Fall 3000 97 000 100 000
icke-fall 297 000 9 603 000 9 900 000
totalt 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

Tabell 1.

förening i den allmänna befolkningen som rapporterats i Berkson2

. exponerad . Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Fall 3000 97 000 100 000
icke-fall 297 000 9 603 000 9 900 000
totalt 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

vi antar nu att studien jämför sjukhusfall med allmänna befolkningskontroller (motsvarande Figur 1b i Snoep et al.1). Vi använder samma sannolikheter för sjukhusvistelse för Sjukdom 1 (exponeringen—0,15) och sjukdom 2 (Fallen—0,05) i Berksons papper. Vi antar också (annorlunda än Berkson2 och från Snoep et al.1) att hela befolkningen har en prevalens på 0,2 och en sjukhusvistelse på 0,025 för någon annan sjukdom än D1 och D2 (dessa olika antaganden innebär att våra siffror skiljer sig något från Berkson2 och Snoep et al.1). Om studien jämför sjukhusfall med allmänna befolkningskontroller som samplatsas från icke-fall med en provtagningsfraktion på 10%, visas motsvarande resultat i Tabell 2. Det uppskattade oddsförhållandet är nu 3.59, på grund av högre exponeringsodds i de inlagda fallen (jämfört med alla fall). Detta orsakas av collider bias som visas i Figur 1b av Snoep et al.1

Tabell 2.

förening med sjukhusfall och allmänna befolkningskontroller

. exponerad . oexponerad . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Fall 590 5311 5901
kontroller 29 700 960 300 990 000
totalt 30 290 965 611 995 901

Odds ratio = 3.59.

Tabell 2.

förening med sjukhusfall och allmänna befolkningskontroller

. exponerad . Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Fall 590 5311 5901
kontroller 29 700 960 300 990 000
totalt 30 290 965 611 995 901

Odds ratio = 3.59.

motsvarande resultat från en studie utförd bland sjukhuspatienter i samma population visas i tabell 3. Förspänningen är nu i motsatt riktning, eftersom ökningen av exponeringsodds i fallen (jämfört med alla fall) mer än kompenseras av en ännu större ökning av exponeringsodds i icke-fallen (jämfört med den allmänna befolkningen). Detta orsakas återigen av colliderförspänningen, som avbildas i Figur 1A i Snoep et al.1

tabell 3.

förening med sjukhusfall och kontroller från patienter på sjukhus för någon sjukdom, med en 0,2 populationsprevalens och en 0.025 Sannolikhet för sjukhusvistelse för någon annan sjukdom än D1 (exponering) eller D2 (fall)

. exponerad . oexponerad . totalt .
Fall 590 5311 5901
Kontroller 45 812 48 015 93 827
Totalt 46 402 53 326 99 728
. exponerad . oexponerad . totalt .
Fall 590 5311 5901
kontroller 45 812 48 015 93 827
totalt 46 402 53 326 99 728

Odds ratio = 0.12.

tabell 3.

förening med sjukhusfall och kontroller från patienter på sjukhus för någon sjukdom, med en 0.2 populationsprevalens och en 0,025 Sannolikhet för sjukhusvistelse för någon annan sjukdom än D1 (exponering) eller D2 (fall)

. exponerad . oexponerad . totalt .
Fall 590 5311 5901
Kontroller 45 812 48 015 93 827
Totalt 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

Tabell 4 visar ett exempel som liknar Berkson,2 där en viss sjukdom har valts för val av kontroller och kontrollsjukdomen har en 0,20 Sannolikhet för sjukhusvistelse och en prevalens på 0,005; oddsförhållandet är nu 2,26, och förspänningen är nu i motsatt riktning till Tabell 3, eftersom sjukhusvistelsen för kontrollsjukdomen är större än sjukhusvistelsen för fallsjukdomen (och därför är ökningen av exponeringen större i Fallen än i kontrollerna).

Tabell 4.

förening med kontroller på sjukhus med en viss sjukdom, med en 0,005 populationsprevalens och en 0,20 Sannolikhet för sjukhusvistelse för kontrollsjukdomen

. exponerad . oexponerad . totalt .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Fall 590 5311 5901
kontroller 480 9757 10 237
totalt 1070 15 068 16 138

Odds ratio = 2.26.

Tabell 4.

förening med kontroller på sjukhus med en viss sjukdom, med en 0,005 populationsprevalens och en 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Fall 590 5311 5901
kontroller 480 9757 10 237
totalt 1070 15 068 16 138

Odds ratio = 2.26.

således, när man använder allmänna befolkningskontroller, tenderar Berksons bias att producera förhöjda oddsförhållanden (när sjukhusvistelsen för fallsjukdomen är mindre än 100%); vid användning av sjukhuskontroller kan förspänningen vara i båda riktningarna.

styrkan och riktningen för förspänning

papperet av Snoep et al. inte bara klargör dessa underliggande mekanismer för Berksons bias; det ger också uppskattningar av dess styrka och riktning under olika omständigheter (se Snoep et al., Tabell 31). Detta avslöjar att när Berkson konstruerade ett scenario som liknar Tabell 4 där graden av sjukhusvistelse i kontrollsjukdomen (brytningsfel) var signifikant högre än i fallet sjukdom (diabetes)-0.2 jämfört med 0.05-oddsförhållandena var starkt förspända uppåt (linje 1 av Snoep et al., tabell 31); när sjukhusvistelsen är lägre i kontrollsjukdomen är oddsförhållandet förspänt nedåt (linjer 4-5 i tabell 3 i Snoep et al.1), medan det inte finns någon bias när sjukhusvistelsen är densamma för de två sjukdomarna och patienter som har både fallet och kontrollsjukdomen räknas endast som fall (linjer 8-9, tabell 3 i Snoep et al.1).

så Berksons bias kan säkert uppstå, men spelar det verkligen någon roll? Som Snoep et al.1 notera, Berksons exempel baserades på en hypotetisk studie som involverade sambandet mellan vanliga fall och en annan vanlig sjukdom (exponeringen). När exponering inte är en direkt orsak till sjukhusvistelse i sig är endast den indirekta formen av Berksons bias relevant—som exemplet om ryggproblemet orsakat av en fotbollskada (se ovan). Denna bias dämpas till stor del genom att använda incidentfall och kan förhindras helt genom att utesluta fall som var inlagda på sjukhus på grund av en annan sjukdom. Detta kan ses från exemplet som beskrivs ovan-många personer med incident mellanörsinfektioner måste läggas in på sjukhus för samtidiga fotbollskador för att materialförspänning ska uppstå. Således, i många (eller kanske mest) troliga situationer, kommer förspänningen att vara extremt liten, särskilt om incidentfall används. Även om det är teoretiskt intressant, i praktiken har det till stor del varit ’mycket väsen för ingenting’.

kanske är huvudbudskapet här att det inte räcker bara för att visa att en bias kan uppstå; det är också nödvändigt att bedöma sannolikheten för att det kommer att inträffa, och dess troliga styrka och riktning. Epidemiologiska studier kritiseras ofta på grundval av potentialen för informationsförspänning eller kvarvarande förvirring. I vissa fall är dessa potentiella problem verkliga och viktiga; i andra är de triviala. Bayesianska metoder blir alltmer tillgängliga för att bedöma den troliga styrkan och riktningen för sådana fördomar.11

vilket leder oss till dags begränsningar. Berksons papper gav extrema resultat eftersom det baserades på vanliga fall, en situation som inte lätt kan representeras av dag. Om vi byter från vanliga fall till incidentfall, alla dag i figurerna 1-6 i Snoep et al.1 ser fortfarande likadant ut, men förspänningarna har i allmänhet blivit triviala. Detta illustrerar ett mer allmänt problem med DAGs-de kan visa att en bias kan uppstå, men ger inte uppskattningar av dess troliga styrka och riktning. Utan detta är det lätt att ge efter för ’analysförlamning’ som härrör från rädslan för att anpassa sig till en potentiell confounder (som också kan vara en collider i en annan väg) eftersom att göra det kan leda till collider bias (’collider ångest’). I vissa situationer kan colliderförspänning vara jämförbar i storlek med okontrollerad förvirring.7 i andra kommer det inte, och fördelen med att kontrollera förvirring kommer att uppväga effekterna av kolliderförspänning. Allt beror på.

finansiering

Centrum för folkhälsoforskning stöds av ett Programbidrag från Health Research Council of New Zealand.

bekräftelser

vi tackar Jan Vandenbroucke för hans kommentarer om utkastet till manuskript.

intressekonflikt: ingen deklarerad.

1

Snoep
JD

Morabia
A

Hernandez-Diaz
S

Hernan
MA

Vandenbroucke
JP

.

en strukturell inställning till Berksons fallacy: och en guide till en historia av åsikter om det

.

Int J Epidemiol
2014

;

43

:

515

21

.

2

Berkson
J

.

begränsningar av tillämpningen av fyrfaldig tabellanalys på sjukhusdata

.

Biometri Bull
1946

;

2

:

47

53

.

Omtryckt Int J Epidemiol 2014;; 43: 511-15.

3

Rothman
KJ

Grönland
S

Lash
TL

.

giltighet i epidemiologiska studier

. I:

Rothman
KJ

Grönland
S

Lash
TL

(Red).

Modern Epidemiologi

. 3: e edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

4

Checkoway
H

Pearce
N

Crawford-Brun
D

.

forskningsmetoder inom Yrkesepidemiologi

.

New York

:

Oxford University Press

,

1989

.

5

Checkoway
H

Pearce
N

Kriebel
D

.

forskningsmetoder inom Yrkesepidemiologi

. 2: a edn.

New York

:

Oxford University Press

,

2004

.

6

Hernan
MA

Hernandez-Diaz
S

Robins
JM

.

en strukturell metod för urvalsförskjutning

.

epidemiologi
2004

;

15

:

615

25

.

7

Grönland
S

.

kvantifiera fördomar i kausala modeller: klassisk confounding vs collider-stratifiering bias

.

epidemiologi
2003

;

14

:

300

06

.

8

Glymour
millimeter

Grönland
S

.

kausala diagram

. I:

Rothman
KJ

Grönland
S

Lash
TL

(Red).

Modern Epidemiologi

. 3: e edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

9

Pizzi
C

De Stavola
B

Merletti
F

et al. .

urval och validitet av uppskattningar av exponering – sjukdomsförening i kohortstudier

.

J Epidemiol Samhällshälsa
2011

;

65

:

407

11

.

10

Westreich
D

.

Berksons bias, selection bias och saknade data

.

epidemiologi
2012

;

23

:

159

64

.

11

Grönland
S

.

Bayesianska perspektiv för epidemiologisk forskning. III. Biasanalys via saknade datametoder

.

Int J Epidemiol
2010

;

39

:

1116

16

.

You might also like

Lämna ett svar

Din e-postadress kommer inte publiceras.