Berksons bias
1984 bodde en av oss (NP) på stranden i Nya Zeeland. Jag skrev min doktorsavhandling, när jag hade en fotboll (’fotboll’) skada som gav mig ett allvarligt ryggproblem i en vecka. Efter de första två dagarna av att ligga på ryggen och lyssna på musik och inte kunna göra mycket annat vaknade jag mitt på natten med illamående och yrsel som uppenbarligen orsakades av en inre öroninfektion. Under de kommande fem dagarna hade jag svår ryggsmärta när jag stod upp, svår illamående och yrsel när jag låg och en blandning av de två när jag satt i en stol. Syftet med att berätta om denna ledsna historia är inte att relatera min medicinska historia till läsare av IJE, utan snarare för att den är relevant för historien om Berksons bias, som jag hade studerat vid den tiden. Jag fick inte in på sjukhus, men det var en nära sak, och det gav mig förstahandserfarenhet av hur ’personer med två eller flera sjukdomar har en högre sannolikhet att läggas in på sjukhus än personer med endast en sjukdom—även om dessa resultat är oberoende’.1 Om jag hade varit på sjukhus och rekryterats för en studie av innerörat infektioner, och om det hade varit tillräckligt andra människor som mig, då vi förmodligen skulle ha bidragit till en falsk slutsats att fotboll skador (som orsakade min rygg problem) var en orsak till innerörat infektioner—detta motsvarar den ’indirekta’ form av Berksons partiskhet,2 som avbildas i figur 3a i tidningen Snoep et al.1
Berksons bias (även kallad ’Berksons fallacy’) är kanske en av de mest kända, men minst väl förstådda formerna av bias. Tidningen av Snoep et al.1 klargör vad bias är, varför det ibland betyder något, men varför det vanligtvis inte gör det.vi kommer att kommentera tre aspekter av papperet: (i) användningen av riktade acykliska grafer (dag); (ii) komponenterna i Berksons bias; och (iii) den troliga styrkan och riktningen för sådana fördomar.
riktade acykliska grafer (dag)
papperet av Snoep et al. illustrerar tydligt kraften och elegansen hos riktade acykliska grafer (dag). Vad vi tidigare använde för att försöka förstå med hjälp av ord, sannolikheter och numeriska exempel kan nu utforskas mycket mer elegant med kausaldiagram. Detta representerar ett verkligt framsteg och klargör många aspekter av Berksons bias.
mer allmänt har dag klargjort det tidigare skumma förhållandet mellan urvalsförskjutning och förvirring. Traditionellt har selektionsbias beskrivits som bias som härrör från olämpligt urval (eller självval) av studieämnen från källpopulationen.3 på en nivå är detta tillräckligt tydligt, men användningen av ordet ’urval’ har ofta lett till att termen tillämpas på olämpligt urval av en jämförelsegrupp,vilket leder till förvirring om fenomen som den friska arbetstagareffekten är exempel på urvalsförskjutning4 eller förvirrande,5, 6 situationen är ytterligare komplicerad eftersom determinanter för urval (t.ex. Ålder, kön, socioekonomisk ställning) effektivt kan bli förvirrare och kontrolleras för i analysen, även om de inte var förvirrare i källpopulationen. Användningen av DAGs klargör detta och skiljer mellan fördomar till följd av (olämplig) konditionering av vanliga effekter (’collider bias’ eller ’selection bias’) och brist på konditionering av vanliga orsaker till exponering och resultat (förvirrande).6,7 de två fenomenen kan förekomma tillsammans, t.ex. när vi villkorar en kolliderare som är effekten av en orsak till resultatet snarare än att vara en effekt av själva resultatet. Vissa skulle märka detta som urvalsförskjutning, 6 andra skulle betrakta det som en typ av förvirring.8,9
även om de tre termerna ibland används nästan omväxlande, är collider bias det mer allmänna fenomenet som involverar konditionering av vanliga effekter (även om Hernan et al.6 använd termen ’selection bias’ för detta mer allmänna fenomen); selection bias är då en viss typ av collider bias där den vanliga effekten är urval i studien; Berksons bias är då en viss typ av urvalsbias10 där urval av fall i studien beror på sjukhusvistelse, och exponeringen är en annan sjukdom eller en orsak till en annan sjukdom, vilket också resulterar i sjukhusvistelse. Det är osannolikt att detta skulle ha blivit så lätt förtydligat utan att använda DAGs.
komponenterna i Berksons bias
i sin nakna väsen kan Berksons bias ses som en partisk uppskattning av oddsen för exponering bland fallen eftersom exponerade fall identifieras med större sannolikhet än icke-exponerade fall, när sjukhusvistelsen för fallen är mindre än 100% och exponeringen är en annan sjukdom, eller en orsak till en annan sjukdom, vilket resulterar i sjukhusvistelse. Det är möjligt att med numeriska exempel illustrera de olika stegen som är involverade i Berksons bias. Låt oss börja med den population som redovisas i Tabell 5 i Berksons paper2 där oddsförhållandet är 1,0 (Tabell 1).
förening i den allmänna befolkningen som rapporterats i Berkson2
. | exponerad . | oexponerad . | totalt . |
---|---|---|---|
Cases | 3000 | 97 000 | 100 000 |
Non-cases | 297 000 | 9 603 000 | 9 900 000 |
Total | 300 000 | 9 700 000 | 10 000 000 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Fall | 3000 | 97 000 | 100 000 |
icke-fall | 297 000 | 9 603 000 | 9 900 000 |
totalt | 300 000 | 9 700 000 | 10 000 000 |
Odds ratio = 1.0.
förening i den allmänna befolkningen som rapporterats i Berkson2
. | exponerad . | Unexposed . | Total . |
---|---|---|---|
Cases | 3000 | 97 000 | 100 000 |
Non-cases | 297 000 | 9 603 000 | 9 900 000 |
Total | 300 000 | 9 700 000 | 10 000 000 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Fall | 3000 | 97 000 | 100 000 |
icke-fall | 297 000 | 9 603 000 | 9 900 000 |
totalt | 300 000 | 9 700 000 | 10 000 000 |
Odds ratio = 1.0.
vi antar nu att studien jämför sjukhusfall med allmänna befolkningskontroller (motsvarande Figur 1b i Snoep et al.1). Vi använder samma sannolikheter för sjukhusvistelse för Sjukdom 1 (exponeringen—0,15) och sjukdom 2 (Fallen—0,05) i Berksons papper. Vi antar också (annorlunda än Berkson2 och från Snoep et al.1) att hela befolkningen har en prevalens på 0,2 och en sjukhusvistelse på 0,025 för någon annan sjukdom än D1 och D2 (dessa olika antaganden innebär att våra siffror skiljer sig något från Berkson2 och Snoep et al.1). Om studien jämför sjukhusfall med allmänna befolkningskontroller som samplatsas från icke-fall med en provtagningsfraktion på 10%, visas motsvarande resultat i Tabell 2. Det uppskattade oddsförhållandet är nu 3.59, på grund av högre exponeringsodds i de inlagda fallen (jämfört med alla fall). Detta orsakas av collider bias som visas i Figur 1b av Snoep et al.1
förening med sjukhusfall och allmänna befolkningskontroller
. | exponerad . | oexponerad . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 29 700 | 960 300 | 990 000 |
Total | 30 290 | 965 611 | 995 901 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Fall | 590 | 5311 | 5901 |
kontroller | 29 700 | 960 300 | 990 000 |
totalt | 30 290 | 965 611 | 995 901 |
Odds ratio = 3.59.
förening med sjukhusfall och allmänna befolkningskontroller
. | exponerad . | Unexposed . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 29 700 | 960 300 | 990 000 |
Total | 30 290 | 965 611 | 995 901 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Fall | 590 | 5311 | 5901 |
kontroller | 29 700 | 960 300 | 990 000 |
totalt | 30 290 | 965 611 | 995 901 |
Odds ratio = 3.59.
motsvarande resultat från en studie utförd bland sjukhuspatienter i samma population visas i tabell 3. Förspänningen är nu i motsatt riktning, eftersom ökningen av exponeringsodds i fallen (jämfört med alla fall) mer än kompenseras av en ännu större ökning av exponeringsodds i icke-fallen (jämfört med den allmänna befolkningen). Detta orsakas återigen av colliderförspänningen, som avbildas i Figur 1A i Snoep et al.1
förening med sjukhusfall och kontroller från patienter på sjukhus för någon sjukdom, med en 0,2 populationsprevalens och en 0.025 Sannolikhet för sjukhusvistelse för någon annan sjukdom än D1 (exponering) eller D2 (fall)
. | exponerad . | oexponerad . | totalt . |
---|---|---|---|
Fall | 590 | 5311 | 5901 |
Kontroller | 45 812 | 48 015 | 93 827 |
Totalt | 46 402 | 53 326 | 99 728 |
. | exponerad . | oexponerad . | totalt . |
---|---|---|---|
Fall | 590 | 5311 | 5901 |
kontroller | 45 812 | 48 015 | 93 827 |
totalt | 46 402 | 53 326 | 99 728 |
Odds ratio = 0.12.
förening med sjukhusfall och kontroller från patienter på sjukhus för någon sjukdom, med en 0.2 populationsprevalens och en 0,025 Sannolikhet för sjukhusvistelse för någon annan sjukdom än D1 (exponering) eller D2 (fall)
. | exponerad . | oexponerad . | totalt . |
---|---|---|---|
Fall | 590 | 5311 | 5901 |
Kontroller | 45 812 | 48 015 | 93 827 |
Totalt | 46 402 | 53 326 | 99 728 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 45 812 | 48 015 | 93 827 |
Total | 46 402 | 53 326 | 99 728 |
Odds ratio = 0.12.
Tabell 4 visar ett exempel som liknar Berkson,2 där en viss sjukdom har valts för val av kontroller och kontrollsjukdomen har en 0,20 Sannolikhet för sjukhusvistelse och en prevalens på 0,005; oddsförhållandet är nu 2,26, och förspänningen är nu i motsatt riktning till Tabell 3, eftersom sjukhusvistelsen för kontrollsjukdomen är större än sjukhusvistelsen för fallsjukdomen (och därför är ökningen av exponeringen större i Fallen än i kontrollerna).
förening med kontroller på sjukhus med en viss sjukdom, med en 0,005 populationsprevalens och en 0,20 Sannolikhet för sjukhusvistelse för kontrollsjukdomen
. | exponerad . | oexponerad . | totalt . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 480 | 9757 | 10 237 |
Total | 1070 | 15 068 | 16 138 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Fall | 590 | 5311 | 5901 |
kontroller | 480 | 9757 | 10 237 |
totalt | 1070 | 15 068 | 16 138 |
Odds ratio = 2.26.
förening med kontroller på sjukhus med en viss sjukdom, med en 0,005 populationsprevalens och en 0.20 probability of hospitalization for the control disease
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 480 | 9757 | 10 237 |
Total | 1070 | 15 068 | 16 138 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Fall | 590 | 5311 | 5901 |
kontroller | 480 | 9757 | 10 237 |
totalt | 1070 | 15 068 | 16 138 |
Odds ratio = 2.26.
således, när man använder allmänna befolkningskontroller, tenderar Berksons bias att producera förhöjda oddsförhållanden (när sjukhusvistelsen för fallsjukdomen är mindre än 100%); vid användning av sjukhuskontroller kan förspänningen vara i båda riktningarna.
styrkan och riktningen för förspänning
papperet av Snoep et al. inte bara klargör dessa underliggande mekanismer för Berksons bias; det ger också uppskattningar av dess styrka och riktning under olika omständigheter (se Snoep et al., Tabell 31). Detta avslöjar att när Berkson konstruerade ett scenario som liknar Tabell 4 där graden av sjukhusvistelse i kontrollsjukdomen (brytningsfel) var signifikant högre än i fallet sjukdom (diabetes)-0.2 jämfört med 0.05-oddsförhållandena var starkt förspända uppåt (linje 1 av Snoep et al., tabell 31); när sjukhusvistelsen är lägre i kontrollsjukdomen är oddsförhållandet förspänt nedåt (linjer 4-5 i tabell 3 i Snoep et al.1), medan det inte finns någon bias när sjukhusvistelsen är densamma för de två sjukdomarna och patienter som har både fallet och kontrollsjukdomen räknas endast som fall (linjer 8-9, tabell 3 i Snoep et al.1).
så Berksons bias kan säkert uppstå, men spelar det verkligen någon roll? Som Snoep et al.1 notera, Berksons exempel baserades på en hypotetisk studie som involverade sambandet mellan vanliga fall och en annan vanlig sjukdom (exponeringen). När exponering inte är en direkt orsak till sjukhusvistelse i sig är endast den indirekta formen av Berksons bias relevant—som exemplet om ryggproblemet orsakat av en fotbollskada (se ovan). Denna bias dämpas till stor del genom att använda incidentfall och kan förhindras helt genom att utesluta fall som var inlagda på sjukhus på grund av en annan sjukdom. Detta kan ses från exemplet som beskrivs ovan-många personer med incident mellanörsinfektioner måste läggas in på sjukhus för samtidiga fotbollskador för att materialförspänning ska uppstå. Således, i många (eller kanske mest) troliga situationer, kommer förspänningen att vara extremt liten, särskilt om incidentfall används. Även om det är teoretiskt intressant, i praktiken har det till stor del varit ’mycket väsen för ingenting’.
kanske är huvudbudskapet här att det inte räcker bara för att visa att en bias kan uppstå; det är också nödvändigt att bedöma sannolikheten för att det kommer att inträffa, och dess troliga styrka och riktning. Epidemiologiska studier kritiseras ofta på grundval av potentialen för informationsförspänning eller kvarvarande förvirring. I vissa fall är dessa potentiella problem verkliga och viktiga; i andra är de triviala. Bayesianska metoder blir alltmer tillgängliga för att bedöma den troliga styrkan och riktningen för sådana fördomar.11
vilket leder oss till dags begränsningar. Berksons papper gav extrema resultat eftersom det baserades på vanliga fall, en situation som inte lätt kan representeras av dag. Om vi byter från vanliga fall till incidentfall, alla dag i figurerna 1-6 i Snoep et al.1 ser fortfarande likadant ut, men förspänningarna har i allmänhet blivit triviala. Detta illustrerar ett mer allmänt problem med DAGs-de kan visa att en bias kan uppstå, men ger inte uppskattningar av dess troliga styrka och riktning. Utan detta är det lätt att ge efter för ’analysförlamning’ som härrör från rädslan för att anpassa sig till en potentiell confounder (som också kan vara en collider i en annan väg) eftersom att göra det kan leda till collider bias (’collider ångest’). I vissa situationer kan colliderförspänning vara jämförbar i storlek med okontrollerad förvirring.7 i andra kommer det inte, och fördelen med att kontrollera förvirring kommer att uppväga effekterna av kolliderförspänning. Allt beror på.
finansiering
Centrum för folkhälsoforskning stöds av ett Programbidrag från Health Research Council of New Zealand.
bekräftelser
vi tackar Jan Vandenbroucke för hans kommentarer om utkastet till manuskript.
intressekonflikt: ingen deklarerad.
.
.
;
:
–
.
.
.
;
:
–
.
.
. I:
(Red).
. 3: e edn.
:
,
.
.
.
:
,
.
.
. 2: a edn.
:
,
.
.
.
;
:
–
.
.
.
;
:
–
.
.
. I:
(Red).
. 3: e edn.
:
,
.
et al. .
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.