Commento: Three worlds collide: Berkson’s bias, selection bias and collider bias

Berkson’s bias

Nel 1984 uno di noi (N. P.) viveva sulla spiaggia in Nuova Zelanda. Stavo scrivendo la mia tesi di dottorato, quando ho avuto un calcio (‘calcio’) infortunio che mi ha dato un grave problema alla schiena per una settimana. Dopo i primi due giorni in giro sulla schiena ad ascoltare musica e non essere in grado di fare molto altro, mi sono svegliato nel cuore della notte con nausea e vertigini apparentemente causati da un’infezione all’orecchio interno. Per i prossimi cinque giorni ho avuto un forte mal di schiena quando mi alzai in piedi, nausea e vertigini quando mi sdraiai e una miscela dei due quando mi sedetti su una sedia. Lo scopo di raccontare questa storia triste non è quello di mettere in relazione la mia storia medica per i lettori di IJE, ma piuttosto perché è rilevante per la storia di bias di Berkson, che avevo studiato al momento. Non sono stato ricoverato in ospedale, ma era una cosa vicina, e mi ha dato un’esperienza di prima mano di come “le persone con due o più malattie hanno una probabilità più alta di essere ricoverate in ospedale rispetto alle persone con una sola malattia—anche se questi risultati sono indipendenti”.1 Se fossi stato ricoverato in ospedale e reclutati per lo studio dell’orecchio interno infezioni, e se ci fosse stato abbastanza altre persone che, come me, allora probabilmente avrebbe contribuito ad una falsa conclusione che il calcio lesioni (che ha causato il mio problema alla schiena) sono causa di infezioni dell’orecchio interno—questo corrisponde al “indirette” forma di Berkson del bias,2 come mostrato in Figura 3a carta di Snoep et al.1

Il bias di Berkson (chiamato anche ‘errore di Berkson’) è forse una delle forme di bias più conosciute, ma meno ben comprese. Il documento di Snoep et al.1 chiarisce qual è il bias, perché a volte è importante, ma perché di solito non lo fa. Commenteremo tre aspetti del documento: (i) l’uso di grafici aciclici diretti (DAG); (ii) le componenti del bias di Berkson; e (iii) la probabile forza e direzione di tali bias.

Grafici aciclici diretti (DAG)

Il documento di Snoep et al. illustra chiaramente la potenza e l’eleganza dei grafici aciclici diretti (DAG). Ciò che in precedenza cercavamo di capire usando parole, probabilità ed esempi numerici, ora può essere esplorato molto più elegantemente usando diagrammi causali. Questo rappresenta un vero progresso e chiarisce molti aspetti del pregiudizio di Berkson.

Più in generale, i DAG hanno chiarito la relazione precedentemente oscura tra bias di selezione e confusione. Tradizionalmente, il bias di selezione è stato descritto come bias derivante da una selezione inappropriata (o auto-selezione) di soggetti di studio dalla popolazione di origine.3 Su un unico livello, questo è abbastanza chiaro, ma l’uso della parola ‘selezione’, ha spesso portato a termine applicato ad una cattiva selezione di un gruppo di confronto, determinando in tal modo confusione dell’esistenza di fenomeni come l’effetto del lavoratore sano sono esempi di selezione bias4 o di confondimento,5,6 La situazione è ulteriormente complicata perché i determinanti di selezione (ad esempio, età, sesso, stato socio-economico di posizione) può effettivamente diventare fattori di confondimento e di essere controllato per l’analisi, anche se non sono stati fattori di confondimento di origine della popolazione. L’uso dei DAG chiarisce questo punto e distingue tra pregiudizi derivanti da condizionamenti (inappropriati) sugli effetti comuni (“collider bias” o “selection bias”) e mancanza di condizionamenti sulle cause comuni di esposizione e risultato (confusione).6,7 I due fenomeni possono verificarsi insieme, ad esempio quando condizioniamo su un collisore che è l’effetto di una causa del risultato piuttosto che essere un effetto del risultato stesso. Alcuni lo etichetterebbero come bias di selezione, altri 6 lo considererebbero anche un tipo di confusione.8,9

Quindi, sebbene i tre termini siano talvolta usati quasi in modo intercambiabile, il bias collider è il fenomeno più generale che coinvolge il condizionamento sugli effetti comuni (sebbene Hernan et al.6 utilizzare il termine ‘bias di selezione’ per questo fenomeno più generale); bias di selezione è quindi un particolare tipo di bias collider in cui l’effetto comune è la selezione nello studio; Bias di Berkson è quindi un particolare tipo di selezione bias10 in cui la selezione dei casi nello studio dipende dal ricovero in ospedale, e l’esposizione è un’altra malattia, o una causa di un’altra malattia, che si traduce anche in ospedalizzazione. È improbabile che questo sarebbe stato così facilmente chiarito senza l’uso di DAG.

I componenti di Berkson del bias

Nella sua nuda essenza, Berkson del bias può essere visto come una parziale stima della probabilità di esposizione tra i casi perché esposti casi vengono identificati con maggiore probabilità rispetto ai non esposti casi, quando il tasso di ospedalizzazione dei casi è inferiore al 100% e l’esposizione è un’altra malattia o a causa di un’altra malattia, che si traduce in ospedale. È possibile illustrare con esempi numerici i diversi passaggi coinvolti nel bias di Berkson. Iniziamo con la popolazione riportata nella Tabella 5 del paper2 di Berkson dove il rapporto di probabilità è 1.0 (Tabella 1).

Tabella 1.

Associazione nella popolazione generale come riportato in Berkson2

. Esposto . Non impressionato . Totale .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Casi 3000 97 000 100 000
Non casi 297 000 9 603 000 9 900 000
Totale 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

Tabella 1.

Associazione nella popolazione generale come riportato in Berkson2

. Esposto . Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Casi 3000 97 000 100 000
Non casi 297 000 9 603 000 9 900 000
Totale 300 000 9 700 000 10 000 000

Odds ratio = 1.0.

Assumiamo ora che lo studio confronti i casi ospedalizzati con i controlli generali della popolazione (corrispondente alla figura 1b di Snoep et al.1). Usiamo le stesse probabilità di ospedalizzazione per la malattia 1 (l’esposizione—0,15) e la malattia 2 (i casi—0,05) del documento di Berkson. Assumiamo anche (diversamente da Berkson2 e da Snoep et al.1) che l’intera popolazione ha una prevalenza di 0,2 e un tasso di ospedalizzazione di 0,025 per qualsiasi altra malattia rispetto a D1 e D2 (queste diverse ipotesi significano che i nostri numeri sono leggermente diversi da quelli di Berkson2 e Snoep et al.1). Se lo studio confronta i casi ospedalizzati con controlli generali della popolazione prelevati da non-casi con una frazione di campionamento del 10%, i risultati corrispondenti sono mostrati nella Tabella 2. L’odds ratio stimato è ora 3.59, a causa delle maggiori probabilità di esposizione nei casi ospedalizzati (rispetto a tutti i casi). Ciò è causato da polarizzazione collider come mostrato in Figura 1b di Snoep et al.1

Tabella 2.

Associazione che utilizza casi ospedalizzati e controlli generali della popolazione

. Esposto . Non impressionato . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Casi 590 5311 5901
Controlli 29 700 960 300 990 000
Totale 30 290 965 611 995 901

Odds ratio = 3.59.

Tabella 2.

Associazione che utilizza casi ospedalizzati e controlli generali della popolazione

. Esposto . Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Casi 590 5311 5901
Controlli 29 700 960 300 990 000
Totale 30 290 965 611 995 901

Odds ratio = 3.59.

I risultati corrispondenti di uno studio condotto tra pazienti ospedalizzati nella stessa popolazione sono riportati nella Tabella 3. Il pregiudizio è ora nella direzione opposta, perché l’aumento delle probabilità di esposizione nei casi (rispetto a tutti i casi) è più che compensato da un aumento ancora maggiore delle probabilità di esposizione nei non casi (rispetto alla popolazione generale). Questo è ancora una volta causato dal bias collider, come illustrato nella Figura 1a di Snoep et al.1

Tabella 3.

Associazione che utilizza casi ospedalizzati e controlli da pazienti ospedalizzati per qualsiasi malattia, con una prevalenza della popolazione 0.2 e uno 0.025 probabilità di ospedalizzazione per qualsiasi malattia diversa da D1 (esposizione) o D2 (casi)

. Esposto . Non impressionato . Totale .
Casi 590 5311 5901
Controlli 45 812 48 015 93 827
Totale 46 402 53 326 99 728
. Esposto . Non impressionato . Totale .
Casi 590 5311 5901
Controlli 45 812 48 015 93 827
Totale 46 402 53 326 99 728

Odds ratio = 0.12.

Tabella 3.

Associazione che utilizza casi ospedalizzati e controlli da pazienti ospedalizzati per qualsiasi malattia, con un 0.2 prevalenza della popolazione e una probabilità di 0,025 di ospedalizzazione per qualsiasi malattia diversa da D1 (esposizione) o D2 (casi)

. Esposto . Non impressionato . Totale .
Casi 590 5311 5901
Controlli 45 812 48 015 93 827
Totale 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

la Tabella 4 mostra un esempio più simile a quella di Berkson,2 in cui una particolare malattia, è stato scelto per la selezione di controlli e il controllo della malattia ha una probabilità 0,20 di ricovero in ospedale e una prevalenza di 0.005; l’odds ratio è ora 2.26, e il pregiudizio è ora nella direzione opposta alla Tabella 3, perché il tasso di ospedalizzazione per il controllo della malattia è maggiore del tasso di ospedalizzazione per il caso di malattia (e quindi l’aumento dell’esposizione è maggiore nei casi rispetto ai controlli).

Tabella 4.

Associazione che utilizza controlli ospedalizzati con una particolare malattia, con una prevalenza di popolazione 0,005 e una probabilità di ospedalizzazione 0,20 per la malattia di controllo

. Esposto . Non impressionato . Totale .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Casi 590 5311 5901
Controlli 480 9757 10 237
Totale 1070 15 068 16 138

Odds ratio = 2.26.

Tabella 4.

Associazione che utilizza controlli ospedalizzati con una particolare malattia, con una prevalenza di popolazione 0.005 e uno 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Casi 590 5311 5901
Controlli 480 9757 10 237
Totale 1070 15 068 16 138

Odds ratio = 2.26.

Pertanto, quando si utilizzano i controlli generali della popolazione, il bias di Berkson tenderà a produrre quote elevate (quando il tasso di ospedalizzazione per il caso malattia è inferiore al 100%); quando si utilizzano i controlli ospedalieri, il pregiudizio può essere in entrambe le direzioni.

La forza e la direzione del bias

Il documento di Snoep et al. non solo chiarisce questi meccanismi sottostanti del pregiudizio di Berkson; fornisce anche stime della sua forza e direzione in una varietà di circostanze (vedi Snoep et al., Tabella 31). Ciò rivela che, quando Berkson costruito uno scenario simile alla Tabella 4 in cui il tasso di ospedalizzazione nella malattia di controllo (errori di rifrazione) era notevolmente superiore nel caso malattia (diabete)-0,2 rispetto a 0.05 – gli odds ratio sono stati fortemente sbilanciati verso l’alto (linea 1 di Snoep et al., tabella 31); quando il tasso di ospedalizzazione è inferiore nella malattia di controllo, il rapporto di probabilità è polarizzato verso il basso (linee 4-5 nella tabella 3 di Snoep et al.1), mentre non vi è alcun pregiudizio quando il tasso di ospedalizzazione è lo stesso per le due malattie e i pazienti che hanno sia il caso che la malattia di controllo sono contati solo come casi (linee 8-9, Tabella 3 di Snoep et al.1).

Quindi il pregiudizio di Berkson può certamente verificarsi, ma ha davvero importanza? Come Snoep et al.1 nota, l’esempio di Berkson era basato su uno studio ipotetico che coinvolgeva l’associazione tra casi prevalenti e un’altra malattia prevalente (l’esposizione). Quando l’esposizione non è una ragione diretta per l’ospedalizzazione in sé, solo la forma indiretta del pregiudizio di Berkson è rilevante—come l’esempio sul problema alla schiena causato da un infortunio al calcio (vedi sopra). Questo pregiudizio è in gran parte attenuato utilizzando casi di incidente e può essere prevenuto completamente escludendo i casi che sono stati ospedalizzati a causa di un’altra malattia. Questo può essere visto dall’esempio sopra descritto: molte persone con infezioni dell’orecchio medio incidenti dovrebbero essere ricoverate in ospedale per lesioni da calcio simultanee per il verificarsi di pregiudizi materiali. Pertanto, in molte (o forse la maggior parte) situazioni plausibili, il pregiudizio sarà estremamente piccolo, in particolare se vengono utilizzati casi di incidente. Anche se è teoricamente interessante, in pratica è stato in gran parte “molto rumore per nulla”.

Forse il messaggio principale qui è che non è sufficiente semplicemente dimostrare che potrebbe verificarsi un pregiudizio; è necessario valutare anche la probabilità che si verifichi e la sua probabile forza e direzione. Gli studi epidemiologici sono spesso criticati sulla base del potenziale di distorsione dell’informazione o confusione residua. In alcuni casi questi potenziali problemi sono reali e importanti; in altri sono banali. I metodi bayesiani stanno diventando sempre più disponibili per valutare la probabile forza e direzione di tali pregiudizi.11

Che ci porta ai limiti dei DAG. Il documento di Berkson ha prodotto risultati estremi perché si basava su casi prevalenti, una situazione che non può essere facilmente rappresentata dai DAG. Se cambiamo da casi prevalenti a casi di incidente, tutti i DAG nelle figure 1-6 in Snoep et al.1 sembra ancora lo stesso, ma i pregiudizi sono generalmente diventati banali. Questo illustra un problema più generale dei DAG: possono mostrare che potrebbe verificarsi un pregiudizio, ma non forniscono stime della sua probabile forza e direzione. Senza questo, è facile soccombere alla “paralisi dell’analisi” che deriva dalla paura di adattarsi a un potenziale confonditore (che potrebbe anche essere un collisore in un altro percorso) perché farlo potrebbe causare pregiudizi collider (“collider anxiety”). In alcune situazioni, polarizzazione collider può essere paragonabile in termini di dimensioni con confusione incontrollata.7 In altri non lo farà, e il beneficio del controllo della confusione supererà di gran lunga gli effetti del bias del collisore. Dipende tutto.

Finanziamento

Il Centro per la ricerca sulla sanità pubblica è sostenuto da una sovvenzione di programma del Consiglio per la ricerca sanitaria della Nuova Zelanda.

Ringraziamenti

Ringraziamo Jan Vandenbroucke per i suoi commenti sul progetto di manoscritto.

Conflitto di interessi: Nessuno dichiarato.

1

Snoep
JD

Morabia
Un

Hernandez-Diaz
S

Hernan
MA

Vandenbroucke
JP

.

A structural approach to Berkson’s fallacy: and a guide to a history of opinions about it

.

Int J Epidemiol
2014

;

43

:

515

21

.

2

Berkson
J

.

Limitazioni dell’applicazione dell’analisi quadrupla della tabella ai dati ospedalieri

.

Biometria Boll
1946

;

2

:

47

53

.

Ristampato Int J Epidemiol 2014;; 43:511-15.

3

Rothman
KJ

Groenlandia
S

Lash
TL

.

Validità negli studi epidemiologici

. In:

Rothman
KJ

Groenlandia
S

Sferza
TL

(eds).

Epidemiologia moderna

. 3 ° edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

4

Checkoway
H

Pearce
N

Crawford-Marrone
D

.

Metodi di ricerca in epidemiologia occupazionale

.

New York

:

Oxford University Press

,

1989

.

5

Checkoway
H

Pearce
N

Kriebel
D

.

Metodi di ricerca in epidemiologia occupazionale

. 2 ° edn.

New York

:

Oxford University Press

,

2004

.

6

Hernan
MA

Hernandez-Diaz
S

Robins
JM

.

Un approccio strutturale al bias di selezione

.

Epidemiologia
2004

;

15

:

615

25

.

7

Groenlandia
S

.

Quantificare i pregiudizi nei modelli causali: confusione classica vs polarizzazione della stratificazione del collider

.

Epidemiologia
2003

;

14

:

300

06

.

8

Glymour
MM

Groenlandia
S

.

Diagrammi causali

. In:

Rothman
KJ

Groenlandia
S

Sferza
TL

(eds).

Epidemiologia moderna

. 3 ° edn.

Philadelphia, PA

:

Lippincott Williams & Wilkins

,

2008

.

9

Pizzi
C

De Stavola
B

Merletti
F

et al. .

Selezione del campione e validità delle stime dell’associazione esposizione-malattia negli studi di coorte

.

J Epidemiol Salute della comunità
2011

;

65

:

407

11

.

10

Westreich
D

.

Bias di Berkson, bias di selezione e dati mancanti

.

Epidemiologia
2012

;

23

:

159

64

.

11

Groenlandia
S

.

Prospettive bayesiane per la ricerca epidemiologica. III. Analisi di bias tramite metodi di dati mancanti

.

Int J Epidemiol
2010

;

39

:

1116

16

.

You might also like

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.