Commentary: Three worlds collide: Berkson’ s bias, selection bias and collider bias

Berkson ‘ s bias

in 1984 woonde een van ons (N. P.) op het strand in Nieuw-Zeeland. Ik was mijn proefschrift aan het schrijven, toen ik een voetbal (‘voetbal’) blessure had die me een week lang een ernstig rugprobleem gaf. Na de eerste twee dagen op mijn rug naar muziek te hebben liggen luisteren en niet veel anders te kunnen doen, werd ik midden in de nacht wakker met misselijkheid en duizeligheid, blijkbaar veroorzaakt door een binnenoorontsteking. De volgende vijf dagen had ik ernstige rugpijn toen ik opstond, ernstige misselijkheid en duizeligheid toen ik ging liggen en een mengsel van de twee toen ik in een stoel zat. Het doel van het vertellen van dit trieste verhaal is niet om mijn medische geschiedenis te relateren aan lezers van IJE, maar eerder omdat het relevant is voor het verhaal van Berkson ‘ s vooroordeel, dat ik op dat moment had bestudeerd. Ik werd niet opgenomen in het ziekenhuis, maar het was een bijna ding, en het gaf me uit de eerste hand ervaring van hoe ‘personen met twee of meer ziekten hebben een grotere kans om te worden opgenomen in het ziekenhuis dan personen met slechts één ziekte—zelfs als deze resultaten onafhankelijk zijn’.1 als ik in het ziekenhuis was opgenomen en gerekruteerd voor een studie naar binnenoorinfecties, en als er genoeg andere mensen zoals ik waren geweest, dan zouden we waarschijnlijk hebben bijgedragen aan een valse conclusie dat voetbalblessures (die mijn rugprobleem veroorzaakten) een oorzaak waren van binnenoorinfecties—dit komt overeen met de ‘indirecte’ vorm van Berkson ‘ s bias,2 zoals afgebeeld in Figuur 3a in het papier van Snoep et al.1

Berkson ’s bias (ook wel’ Berkson ’s fallacy’ genoemd) is misschien wel een van de bekendste, maar minst begrepen vormen van bias. De krant van Snoep et al.1 verduidelijkt wat de vooringenomenheid is, waarom het soms belangrijk is, maar waarom het meestal niet. we zullen commentaar geven op drie aspecten van het artikel: (i) het gebruik van gerichte acyclische grafieken (DAGs); (ii) de componenten van Berkson ‘ s vooringenomenheid; en (iii) de waarschijnlijke sterkte en richting van dergelijke vooringenomenheid.

gerichte acyclische grafieken (DAGs)

het papier van Snoep et al. illustreert duidelijk de kracht en elegantie van gerichte acyclische grafieken (DAGs). Wat we vroeger probeerden te begrijpen met behulp van woorden, waarschijnlijkheden en numerieke voorbeelden, kan nu veel eleganter worden onderzocht met behulp van causale diagrammen. Dit betekent een echte vooruitgang, en verduidelijkt veel aspecten van de vooringenomenheid van Berkson.

meer in het algemeen hebben de dag ‘ s de eerder troebele relatie tussen selectievooroordeel en verstorende factoren verduidelijkt. Traditioneel wordt selectiebias beschreven als bias die het gevolg is van ongepaste selectie (of zelfselectie) van proefpersonen uit de bronpopulatie.3 Op een niveau dat is duidelijk genoeg, maar het gebruik van het woord ‘selectie’ heeft vaak geleid tot de term wordt toegepast op ongepaste selectie van een vergelijking van de groep, hetgeen leidt tot verwarring of verschijnselen zoals het healthy worker effect zijn voorbeelden van de selectie bias4 of van confounding,5,6 De situatie is nog ingewikkelder omdat de determinanten van de keuze (bijv. leeftijd, geslacht, sociaal-economische positie) kan effectief worden beïnvloedende factoren en beheerd worden voor de in de analyse, zelfs als ze niet beïnvloedende factoren in de bron van de bevolking. Het gebruik van dag’s verduidelijkt dit en maakt een onderscheid tussen vooroordelen als gevolg van (ongepaste) conditionering van gemeenschappelijke effecten (‘collider bias ‘of’ selection bias’) en gebrek aan conditionering van gemeenschappelijke oorzaken van blootstelling en resultaat (verstorende effecten).6,7 de twee fenomenen kunnen samen voorkomen, bijvoorbeeld wanneer we conditioneren op een collider die het effect is van een oorzaak van de uitkomst in plaats van een effect van de uitkomst zelf. Sommigen zouden dit bestempelen als selectie bias,6 anderen zouden het ook beschouwen als een soort van verstorende.8,9

hoewel de drie termen soms bijna onderling verwisselbaar worden gebruikt, is botsingsbias het meer algemene verschijnsel waarbij conditionering van de gemeenschappelijke effecten plaatsvindt (hoewel Hernan et al.6 Gebruik de term ‘selectie bias’ voor dit meer algemene fenomeen) ; selectie bias is dan een bepaald type van collider bias waarbij het gemeenschappelijke effect is Selectie in de studie; De bias van Berkson is dan een bepaald type selectie bias10 waarin de selectie van gevallen in de studie afhankelijk is van ziekenhuisopname, en de blootstelling is een andere ziekte, of een oorzaak van een andere ziekte, die ook resulteert in ziekenhuisopname. Het is onwaarschijnlijk dat dit zo gemakkelijk zou zijn opgehelderd zonder het gebruik van DGS.

de componenten van Berkson ’s bias

in essentie kan Berkson’ s bias worden gezien als een bevooroordeelde schatting van de kans op blootstelling onder de gevallen, omdat blootgestelde gevallen met een grotere waarschijnlijkheid worden geïdentificeerd dan niet-blootgestelde gevallen, wanneer het aantal ziekenhuisopnamen voor de gevallen minder dan 100% bedraagt en de blootstelling een andere ziekte is, of een oorzaak van een andere ziekte, die resulteert in ziekenhuisopname. Het is mogelijk om met numerieke voorbeelden de verschillende stappen te illustreren die betrokken zijn bij Berkson ‘ s vooringenomenheid. Laten we beginnen met de populatie gerapporteerd in Tabel 5 van Berkson ‘ s paper2 waar de odds ratio 1.0 is (Tabel 1).

Tabel 1.

associatie bij de algemene bevolking zoals gerapporteerd in Berkson2

. blootgesteld . onbelicht . totaal .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Gevallen 3000 97 000 100 000
Niet-gevallen 297 000 9 603 000 9 900 000
Totaal 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

Tabel 1.

associatie bij de algemene bevolking zoals gerapporteerd in Berkson2

. blootgesteld . Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Gevallen 3000 97 000 100 000
Niet-gevallen 297 000 9 603 000 9 900 000
Totaal 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

we gaan er nu van uit dat de studie gehospitaliseerde gevallen vergelijkt met algemene bevolkingscontroles (overeenkomend met Figuur 1b van Snoep et al.1). We gebruiken dezelfde kansen van ziekenhuisopname voor ziekte 1 (de blootstelling-0,15), en ziekte 2 (de gevallen—0,05) van het Berkson papier. We gaan er ook vanuit (anders dan Berkson2 en van Snoep et al.1) dat de hele populatie een prevalentie van 0,2 en een hospitalisatiepercentage van 0,025 heeft voor een andere ziekte dan D1 en D2 (deze verschillende veronderstellingen betekenen dat onze aantallen lichtjes verschillen van die van Berkson2 en Snoep et al.1). Als het onderzoek gehospitaliseerde gevallen vergelijkt met algemene populatiecontroles die zijn bemonsterd van niet-gevallen met een bemonsteringsfractie van 10%, worden de overeenkomstige bevindingen weergegeven in Tabel 2. De geschatte odds ratio is nu 3,59, vanwege de hogere blootstelling odds in de gehospitaliseerde gevallen (vergeleken met alle gevallen). Dit wordt veroorzaakt door botsingsbias zoals weergegeven in Figuur 1b van Snoep et al.1

Tabel 2.

associatie met gehospitaliseerde gevallen en algemene bevolkingscontroles

. blootgesteld . onbelicht . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Gevallen 590 5311 5901
Besturingselementen 29 700 960 300 990 000
Totaal 30 290 965 611 995 901

Odds ratio = 3.59.

Tabel 2.

associatie met gehospitaliseerde gevallen en algemene bevolkingscontroles

. blootgesteld . Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Gevallen 590 5311 5901
Besturingselementen 29 700 960 300 990 000
Totaal 30 290 965 611 995 901

Odds ratio = 3.59.

de overeenkomstige bevindingen van een studie uitgevoerd bij gehospitaliseerde patiënten in dezelfde populatie zijn weergegeven in Tabel 3. De bias is nu in de tegenovergestelde richting, omdat de toename van de blootstelling odds in de gevallen (vergeleken met alle gevallen) meer dan gecompenseerd wordt door een nog grotere toename van de blootstelling odds in de niet-gevallen (vergeleken met de algemene populatie). Dit wordt weer veroorzaakt door de botsingsvooroordeel, zoals afgebeeld in Figuur 1a van Snoep et al.1

Tabel 3.

associatie met gehospitaliseerde gevallen en controles van gehospitaliseerde patiënten voor elke ziekte, met een prevalentie van 0,2 populatie en een 0.025 kans op ziekenhuisopname voor een andere ziekte dan D1 (blootstelling) of D2 (gevallen)

. blootgesteld . onbelicht . totaal .
Gevallen 590 5311 5901
Besturingselementen 45 812 48 015 93 827
Totaal 46 402 53 326 99 728
. blootgesteld . onbelicht . totaal .
Gevallen 590 5311 5901
Besturingselementen 45 812 48 015 93 827
Totaal 46 402 53 326 99 728

Odds ratio = 0.12.

Tabel 3.

associatie met gehospitaliseerde gevallen en controles van gehospitaliseerde patiënten voor elke ziekte, met een 0.2 populatieprevalentie en 0,025 kans op ziekenhuisopname voor een andere ziekte dan D1 (blootstelling) of D2 (gevallen)

. blootgesteld . onbelicht . totaal .
Gevallen 590 5311 5901
Besturingselementen 45 812 48 015 93 827
Totaal 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

Tabel 4 toont een voorbeeld van een meer vergelijkbaar met die van Berkson,2 waarin een bepaalde ziekte heeft gekozen voor de selectie van de controles en de controle van de ziekte heeft een 0.20 waarschijnlijkheid van een ziekenhuisopname en een prevalentie van 0,005; de odds ratio is nu 2.26, en de bias is nu in de tegenovergestelde richting van de Tabel 3, omdat de hospitalisatie tarief voor de controle-en vaatziekten groter dan de hospitalisatie tarief voor het geval van ziekte (en dus de toename in de blootstelling groter is in de gevallen dan in de controlegroep).

Tabel 4.

associatie met controlegroepen die met een bepaalde ziekte zijn gehospitaliseerd, met een prevalentie van 0,005 populatie en een kans van 0,20 op ziekenhuisopname voor de controleziekte

. blootgesteld . onbelicht . totaal .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Gevallen 590 5311 5901
Besturingselementen 480 9757 10 237
Totaal 1070 15 068 16 138

Odds ratio = 2.26.

Tabel 4.

associatie met controlegroepen die met een bepaalde ziekte zijn gehospitaliseerd, met een prevalentie van 0,005 en een 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Gevallen 590 5311 5901
Besturingselementen 480 9757 10 237
Totaal 1070 15 068 16 138

Odds ratio = 2.26.

dus, bij het gebruik van algemene populatie controles, zal de bias Berkson de neiging om verhoogde odds ratio ‘ s produceren (wanneer de ziekenhuisopname tarief voor de ziekte van het geval is minder dan 100%); bij het gebruik van ziekenhuiscontroles, kan de vooringenomenheid in beide richtingen zijn.

de sterkte en richting van de bias

het papier van Snoep et al. niet alleen verduidelijkt deze onderliggende mechanismen van de vooringenomenheid van Berkson; het geeft ook schattingen van de sterkte en richting in een verscheidenheid van omstandigheden (zie Snoep et al., Tabel 31). Dit toont aan dat, toen Berkson een scenario bedacht dat vergelijkbaar is met Tabel 4, waarin het percentage van ziekenhuisopname in de controle ziekte (refractieve fouten) was aanzienlijk hoger dan in het geval ziekte (diabetes)-0,2 in vergelijking met 0.05 – de odds ratio ‘ s waren sterk naar boven gericht (lijn 1 van Snoep et al., tabel 31); wanneer het aantal ziekenhuisopnamen lager is in de controleziekte, is de odds ratio naar beneden vertekend (regels 4-5 in Tabel 3 van Snoep et al.1), terwijl er geen vertekening is wanneer het percentage ziekenhuisopname hetzelfde is voor de twee ziekten en patiënten die zowel het geval als de controleziekte hebben, worden alleen geteld als gevallen (regels 8-9, Tabel 3 van Snoep et al.1).

dus Berkson ‘ s vooroordeel kan zeker voorkomen, maar maakt het echt uit? As Snoep et al.1 opmerking, Berkson ‘ s voorbeeld was gebaseerd op een hypothetische studie waarbij de associatie tussen prevalente gevallen en een andere prevalente ziekte (de blootstelling). Wanneer blootstelling op zich geen directe reden is voor ziekenhuisopname, is alleen de indirecte vorm van Berkson ‘ s vooroordeel relevant—zoals het voorbeeld over het rugprobleem veroorzaakt door een voetbalblessure (zie hierboven). Dit vooroordeel wordt grotendeels verzwakt door incidentgevallen te gebruiken en kan volledig worden voorkomen door gevallen uit te sluiten die wegens een andere ziekte in het ziekenhuis werden opgenomen. Dit kan worden gezien uit het hierboven beschreven voorbeeld-veel mensen met incident middenoor infecties zou moeten worden opgenomen in het ziekenhuis voor gelijktijdige voetbal verwondingen voor materiële bias optreden. In veel (of misschien wel de meeste) plausibele situaties zal de vooringenomenheid dus uiterst klein zijn, vooral als incidentgevallen worden gebruikt. Hoewel het theoretisch interessant is, is het in de praktijk grotendeels ‘much ado about nothing’geweest.

misschien is de belangrijkste boodschap hier dat het niet voldoende is om alleen aan te tonen dat een vertekening kan optreden; het is noodzakelijk om ook de waarschijnlijkheid dat het zal optreden, en de waarschijnlijke sterkte en richting te beoordelen. Epidemiologische studies worden vaak bekritiseerd op basis van het potentieel voor informatiebias of resterende verstorende. In sommige gevallen zijn deze potentiële problemen reëel en belangrijk; in andere zijn ze triviaal. Bayesiaanse methoden worden steeds meer beschikbaar om de waarschijnlijke sterkte en richting van dergelijke vooroordelen te beoordelen.11

dat brengt ons bij de beperkingen van de dag ‘ s. Berkson ‘ s paper leverde extreme resultaten op omdat het gebaseerd was op gangbare gevallen, een situatie die niet gemakkelijk kan worden vertegenwoordigd door DGS. Als we veranderen van voorkomende gevallen naar incident gevallen, alle van de DAGs in cijfers 1-6 in Snoep et al.1 ziet er nog steeds hetzelfde uit, maar de vooroordelen zijn over het algemeen triviaal geworden. Dit illustreert een meer algemeen probleem van DAGs-ze kunnen aantonen dat een vooroordeel kan optreden, maar geven geen schattingen van de waarschijnlijke sterkte en richting. Zonder dit, is het gemakkelijk om te bezwijken voor ‘analyse verlamming’ die voortkomt uit de angst om zich aan te passen voor een potentiële confounder (die ook een collider in een ander pad zou kunnen zijn) omdat dit zou kunnen resulteren in botsingsvooroordeel (‘Collider anxiety’). In sommige situaties, Collider bias kan vergelijkbaar zijn in grootte met ongecontroleerde verstorende.7 in andere zal het niet, en het voordeel van het beheersen van verstorende zal veel opwegen tegen de effecten van botsingsvooroordeel. Dat hangt ervan af.

financiering

het Centre for Public Health research wordt ondersteund door een Programmasubsidie van de Health Research Council of New Zealand.

Dankbetuigingen

Wij danken Jan Vandenbroucke voor zijn commentaar op het conceptmanuscript.

belangenconflict: geen gedeclareerd.

1

Snoep
JD

Morabia
Een

Hernandez-Diaz
S

Hernan
MA

Vandenbroucke
JP

.

a structural approach to Berkson ‘ s fallacy: and a guide to a history of opinions about it

.

Int J Epidemiol
2014

;

43

:

515

21

.

2

Berkson
J

.

beperkingen van de toepassing van viervoudige tabelanalyse op ziekenhuisgegevens

.

Biometrie Bull
1946

;

2

:

47

53

.

Herdrukt Int J Epidemiol 2014;; 43: 511-15.

3

Rothman
KJ

Groenland
S

Lash
TL

.

validiteit in epidemiologische studies

. In:

Rothman
KJ

Groenland
S

Lash
TL

(eds).

Moderne Epidemiologie

. 3rd edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

4

Checkoway
H

Pearce
N

Crawford-Brown
D

.

onderzoeksmethoden in de Beroepsepidemiologie

.

New York

:

Oxford University Press

,

1989

.

5

Checkoway
H

Pearce
N

Kriebel
D

.

onderzoeksmethoden in de Beroepsepidemiologie

. 2nd edn.

New York

:

Oxford University Press

,

2004

.

6

Hernan
MA

Hernandez-Diaz
S

Robins
JM

.

a structural approach to selection bias

.

Epidemiologie
2004

;

15

:

615

25

.

7

Groenland
S

.

Kwantificerende biases in causale modellen: Classical confounding vs collider-stratification bias

.

Epidemiologie
2003

;

14

:

300

06

.

8

Glymour
MM

Groenland
S

.

Causale diagrammen

. In:

Rothman
KJ

Groenland
S

Lash
TL

(eds).

Moderne Epidemiologie

. 3rd edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

9

Pizzi
C

De Stavola
B

Merletti
F

et al. .

Monsterselectie en geldigheid van schattingen van blootstelling-ziekte associatie in cohortstudies

.

PB Epidemiol Gezondheid Van De Gemeenschap
2011

;

65

:

407

11

.

10

Westreich
D

.

bias van Berkson, selectie bias, en ontbrekende gegevens

.

Epidemiologie
2012

;

23

:

159

64

.

11

Groenland
S

. Bayesian perspectives for epidemiologic research . III. Bias analyse via ontbrekende-data methoden

.

Int J Epidemiol
2010

;

39

:

1116

16

.

You might also like

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.