Commentaire: Three worlds collide: Berkson’s bias, selection bias and collider bias

Berkson’s bias

En 1984, l’un d’entre nous (N.P.) vivait sur la plage en Nouvelle-Zélande. J’étais en train d’écrire ma thèse de doctorat, quand j’ai eu une blessure au football (« soccer ») qui m’a donné un grave problème de dos pendant une semaine. Après les deux premiers jours de traîner sur le dos en écoutant de la musique et de ne pas pouvoir faire grand-chose d’autre, je me suis réveillé au milieu de la nuit avec des nausées et des vertiges apparemment causés par une infection de l’oreille interne. Pendant les cinq jours suivants, j’ai eu de fortes douleurs au dos lorsque je me suis levé, de fortes nausées et des étourdissements lorsque je me suis allongé et un mélange des deux lorsque je me suis assis sur une chaise. Le but de raconter cette triste histoire n’est pas de relier mes antécédents médicaux aux lecteurs de l’IJE, mais plutôt parce qu’ils sont pertinents pour l’histoire du parti pris de Berkson, que j’étudiais à l’époque. Je n’ai pas été admise à l’hôpital, mais c’était une chose proche, et cela m’a donné une expérience directe de la façon dont « les personnes atteintes de deux maladies ou plus ont une probabilité plus élevée d’être hospitalisées que les personnes atteintes d’une seule maladie — même si ces résultats sont indépendants ».1 Si j’avais été hospitalisé et recruté pour une étude sur les infections de l’oreille interne, et s’il y avait eu suffisamment d’autres personnes comme moi, alors nous aurions probablement contribué à une fausse conclusion selon laquelle les blessures au football (qui ont causé mon problème de dos) étaient une cause d’infections de l’oreille interne — cela correspond à la forme « indirecte » du biais de Berkson2, comme illustré à la figure 3a dans l’article de Snoep et al.1

Le biais de Berkson (également appelé « erreur de Berkson ») est peut-être l’une des formes de biais les plus connues, mais les moins bien comprises. L’article de Snoep et coll.1 clarifie ce qu’est le biais, pourquoi il est parfois important, mais pourquoi il ne l’est généralement pas.Nous commenterons trois aspects de l’article: (i) l’utilisation de Graphes acycliques dirigés (DAG); (ii) les composantes du biais de Berkson; et (iii) la force et la direction probables de tels biais.

Graphes acycliques dirigés (DAG)

L’article de Snoep et al. illustre clairement la puissance et l’élégance des Graphes acycliques dirigés (DAG). Ce que nous essayions auparavant de comprendre à l’aide de mots, de probabilités et d’exemples numériques, peut maintenant être exploré beaucoup plus élégamment à l’aide de diagrammes causaux. Cela représente une réelle avancée et clarifie de nombreux aspects du parti pris de Berkson.

Plus généralement, les DAG ont clarifié la relation précédemment trouble entre le biais de sélection et la confusion. Traditionnellement, le biais de sélection a été décrit comme un biais résultant d’une sélection inappropriée (ou d’une auto-sélection) des sujets d’étude de la population source.3 Sur un plan, cela est assez clair, mais l’utilisation du mot « sélection » a souvent conduit à appliquer le terme à une sélection inappropriée d’un groupe témoin, ce qui a conduit à une confusion quant à savoir si des phénomènes tels que l’effet travailleur en bonne santé sont des exemples de biais de sélection4 ou de confusion,5,6 La situation est encore plus compliquée parce que les déterminants de la sélection (par exemple l’âge, le sexe, la position socioéconomique) peuvent effectivement devenir des facteurs de confusion et être contrôlés dans l’analyse, même s’ils n’étaient pas des facteurs de confusion dans la population source. L’utilisation des DAG clarifie cela et fait la distinction entre les biais résultant d’un conditionnement (inapproprié) sur les effets communs (« biais de collisionneur » ou « biais de sélection ») et l’absence de conditionnement sur les causes communes d’exposition et de résultat (confusion).6,7 Les deux phénomènes peuvent se produire ensemble, par exemple lorsque nous conditionnons un collisionneur qui est l’effet d’une cause du résultat plutôt que d’être un effet du résultat lui-même. Certains qualifieraient cela de biais de sélection,6 d’autres considéreraient qu’il s’agit également d’un type de confusion.8,9

Ainsi, bien que les trois termes soient parfois utilisés de manière presque interchangeable, le biais du collisionneur est le phénomène le plus général impliquant le conditionnement sur des effets communs (bien que Hernan et al.6 utilisez le terme « biais de sélection » pour ce phénomène plus général); le biais de sélection est alors un type particulier de biais de collisionneur dans lequel l’effet commun est la sélection dans l’étude; Le biais de Berkson est alors un type particulier de biais de sélection10 dans lequel la sélection des cas dans l’étude dépend de l’hospitalisation, et l’exposition est une autre maladie, ou une cause d’une autre maladie, ce qui entraîne également une hospitalisation. Il est peu probable que cela aurait été aussi facilement clarifié sans l’utilisation de DAG.

Les composantes du biais de Berkson

Dans son essence même, le biais de Berkson peut être considéré comme une estimation biaisée des chances d’exposition parmi les cas parce que les cas exposés sont identifiés avec une plus grande probabilité que les cas non exposés, lorsque le taux d’hospitalisation pour les cas est inférieur à 100% et que l’exposition est une autre maladie, ou une cause d’une autre maladie, qui entraîne une hospitalisation. Il est possible d’illustrer par des exemples numériques les différentes étapes impliquées dans le biais de Berkson. Commençons par la population indiquée dans le tableau 5 de l’article de Berkson2 où le rapport de cotes est de 1,0 (tableau 1).

Tableau 1.

Association dans la population générale telle que rapportée dans Berkson2

. Exposé. Non exposé. Total.
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Cas 3000 97 000 100 000
Non-cas 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000

Rapport de cotes = 1,0.

Tableau 1.

Association dans la population générale telle que rapportée dans Berkson2

. Exposé. Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
Cas 3000 97 000 100 000
Non-cas 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000

Rapport de cotes = 1,0.

Nous supposons maintenant que l’étude compare les cas hospitalisés avec les témoins de la population générale (correspondant à la figure 1b de Snoep et al.1). Nous utilisons les mêmes probabilités d’hospitalisation pour la maladie 1 (l’exposition — 0,15) et la maladie 2 (les cas — 0,05) de l’article de Berkson. Nous supposons également (différemment de Berkson2 et de Snoep et al.1) que l’ensemble de la population a une prévalence de 0,2 et un taux d’hospitalisation de 0,025 pour toute autre maladie que D1 et D2 (ces différentes hypothèses signifient que nos chiffres sont légèrement différents de ceux de Berkson2 et Snoep et al.1). Si l’étude compare les cas hospitalisés avec des témoins de la population générale échantillonnés à partir de non-cas avec une fraction d’échantillonnage de 10%, les résultats correspondants sont présentés dans le tableau 2. Le rapport de cotes estimé est maintenant de 3,59, en raison des cotes d’exposition plus élevées dans les cas hospitalisés (par rapport à tous les cas). Ceci est causé par le biais du collisionneur, comme le montre la figure 1b de Snoep et al.1

Tableau 2.

Association utilisant des cas hospitalisés et des contrôles de la population générale

. Exposé. Non exposé. Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Cas 590 5311 5901
Contrôles 29 700 960 300 990 000
Total 30 290 965 611 995 901

Rapport de cotes = 3,59.

Tableau 2.

Association utilisant des cas hospitalisés et des contrôles de la population générale

. Exposé. Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
Cas 590 5311 5901
Contrôles 29 700 960 300 990 000
Total 30 290 965 611 995 901

Rapport de cotes = 3,59.

Les résultats correspondants d’une étude menée auprès de patients hospitalisés dans la même population sont présentés dans le tableau 3. Le biais est maintenant dans la direction opposée, car l’augmentation des chances d’exposition dans les cas (par rapport à tous les cas) est plus que compensée par une augmentation encore plus grande des chances d’exposition dans les non-cas (par rapport à la population générale). Ceci est à nouveau causé par le biais du collisionneur, comme illustré à la figure 1a de Snoep et al.1

Tableau 3.

Association utilisant des cas hospitalisés et des témoins de patients hospitalisés pour n’importe quelle maladie, avec une prévalence de 0,2 dans la population et un 0.025 probabilité d’hospitalisation pour toute maladie autre que J1 (exposition) ou J2 (cas)

. Exposé. Non exposé. Total.
Cas 590 5311 5901
Contrôles 45 812 48 015 93 827
Total 46 402 53 326 99 728
. Exposé. Non exposé. Total.
Cas 590 5311 5901
Contrôles 45 812 48 015 93 827
Total 46 402 53 326 99 728

Rapport de cotes = 0,12.

Tableau 3.

Association utilisant des cas hospitalisés et des témoins de patients hospitalisés pour une maladie quelconque, avec un 0.2 prévalence de la population et probabilité d’hospitalisation de 0,025 pour toute maladie autre que J1 (exposition) ou J2 (cas)

. Exposé. Non exposé. Total.
Cas 590 5311 5901
Contrôles 45 812 48 015 93 827
Total 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

Le tableau 4 montre un exemple plus similaire à celui de Berkson2, dans lequel une maladie particulière a été choisie pour la sélection des témoins et la maladie témoin a une probabilité d’hospitalisation de 0,20 et une prévalence de 0,005; le rapport de cotes est maintenant de 2,26, et le biais est maintenant dans la direction opposée au tableau 3, car le taux d’hospitalisation pour la maladie témoin est supérieur au taux d’hospitalisation pour la maladie de cas (et donc l’augmentation de l’exposition est plus grande dans les cas que dans les témoins).

Tableau 4.

Association utilisant des témoins hospitalisés avec une maladie particulière, avec une prévalence de la population de 0,005 et une probabilité d’hospitalisation de 0,20 pour la maladie témoin

. Exposé. Non exposé. Total.
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Cas 590 5311 5901
Contrôles 480 9757 10 237
Total 1070 15 068 16 138

Rapport de cotes = 2,26.

Tableau 4.

Association avec des témoins hospitalisés pour une maladie particulière, avec une prévalence de population de 0,005 et une prévalence de 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
Cas 590 5311 5901
Contrôles 480 9757 10 237
Total 1070 15 068 16 138

Rapport de cotes = 2,26.

Ainsi, lors de l’utilisation de témoins de la population générale, le biais de Berkson aura tendance à produire des rapports de cotes élevés (lorsque le taux d’hospitalisation pour la maladie de cas est inférieur à 100%); lors de l’utilisation de contrôles hospitaliers, le biais peut être dans les deux sens.

La force et la direction du biais

L’article de Snoep et al. non seulement clarifie ces mécanismes sous-jacents du biais de Berkson, mais il fournit également des estimations de sa force et de sa direction dans diverses circonstances (voir Snoep et al., Tableau 31). Cela révèle que, lorsque Berkson a construit un scénario similaire au tableau 4 dans lequel le taux d’hospitalisation dans la maladie témoin (erreurs de réfraction) était considérablement plus élevé que dans le cas de la maladie (diabète) -0,2 par rapport à 0.05 – les rapports de cotes étaient fortement biaisés à la hausse (ligne 1 de Snoep et al., tableau 31); lorsque le taux d’hospitalisation est plus faible dans la maladie témoin, le rapport de cotes est biaisé vers le bas (lignes 4 à 5 du tableau 3 de Snoep et al.1), alors qu’il n’y a pas de biais lorsque le taux d’hospitalisation est le même pour les deux maladies et que les patients qui ont à la fois le cas et la maladie témoin ne sont comptabilisés que comme des cas (lignes 8-9, tableau 3 de Snoep et al.1).

Le biais de Berkson peut donc certainement se produire, mais est-ce vraiment important? Comme Snoep et coll.1 remarque, l’exemple de Berkson était basé sur une étude hypothétique impliquant l’association entre les cas prévalents et une autre maladie prévalente (l’exposition). Lorsque l’exposition n’est pas une raison directe d’hospitalisation en soi, seule la forme indirecte du biais de Berkson est pertinente — comme l’exemple du problème de dos causé par une blessure au football (voir ci-dessus). Ce biais est largement atténué par l’utilisation de cas incidents et peut être complètement évité en excluant les cas qui ont été hospitalisés en raison d’une autre maladie. Cela peut être vu à partir de l’exemple décrit ci—dessus – de nombreuses personnes atteintes d’infections de l’oreille moyenne incidentes devraient être hospitalisées pour des blessures simultanées au football pour qu’un biais matériel se produise. Ainsi, dans de nombreuses situations (ou peut-être la plupart) plausibles, le biais sera extrêmement faible, en particulier si des cas d’incident sont utilisés. Bien qu’il soit théoriquement intéressant, dans la pratique, cela a été en grande partie « beaucoup de bruit pour rien ».

Le message principal ici est peut-être qu’il ne suffit pas de démontrer qu’un biais pourrait se produire; il est également nécessaire d’évaluer la probabilité qu’il se produise, ainsi que sa force et sa direction probables. Les études épidémiologiques sont souvent critiquées en raison du risque de biais d’information ou de confusion résiduelle. Dans certains cas, ces problèmes potentiels sont réels et importants; dans d’autres, ils sont triviaux. Les méthodes bayésiennes sont de plus en plus disponibles pour évaluer la force et la direction probables de tels biais.11

Ce qui nous amène aux limites des DAG. L’article de Berkson a produit des résultats extrêmes parce qu’il était basé sur des cas répandus, une situation qui ne peut pas être facilement représentée par les DAG. Si nous passons de cas répandus à des cas incidents, tous les DAG des figures 1 à 6 dans Snoep et al.1 se ressemblent toujours, mais les biais sont généralement devenus triviaux. Cela illustre un problème plus général des DAG — ils peuvent montrer qu’un biais pourrait se produire, mais ne fournissent pas d’estimations de sa force et de sa direction probables. Sans cela, il est facile de succomber à la « paralysie de l’analyse » qui découle de la peur de s’adapter à un facteur de confusion potentiel (qui pourrait également être un collisionneur dans un autre chemin) car cela pourrait entraîner un biais du collisionneur (« anxiété du collisionneur »). Dans certaines situations, le biais du collisionneur peut être comparable en taille avec une confusion incontrôlée.7 Dans d’autres, ce ne sera pas le cas, et l’avantage du contrôle de la confusion l’emportera de loin sur les effets du biais du collisionneur. Tout dépend.

Financement

Le Centre de recherche en santé publique est soutenu par une subvention du Health Research Council of New Zealand.

Remerciements

Nous remercions Jan Vandenbroucke pour ses commentaires sur le projet de manuscrit.

Conflit d’intérêts : Aucun n’a été déclaré.

1

Snoep
JD

Morabia
A

Hernandez-Diaz
L

Hernan
MA

Vandenbroucke
JP

.

A structural approach to Berkson’s fallacy: and a guide to a history of opinions about it

.

Int J Epidemiol
2014

;

43

:

515

21

.

2

Berkson
J

.

Limites de l’application de l’analyse à quatre tableaux aux données hospitalières

.

Biométrie Bull
1946

;

2

:

47

53

.

Réimprimé Int J Epidemiol 2014;; 43:511-15.

3

Rothman
KJ

Groenland
S

Cils
TL

.

Validité dans les études épidémiologiques

. Dans :

Rothman
KJ

Groenland
S

Cils
TL

(eds).

Épidémiologie moderne

. 3e éd.

Philadelphie, Pennsylvanie

:

Lippincott Williams & Wilkins

,

2008

.

4

Passerelle
H

Pearce
N

Crawford-Brown
D

.

Méthodes de recherche en Épidémiologie professionnelle

.

New York

:

Oxford University Press

,

1989

.

5

Passerelle
H

Pearce
N

Kriebel
D

.

Méthodes de recherche en Épidémiologie professionnelle

. 2e éd.

New York

:

Oxford University Press

,

2004

.

6

Hernan
MA

Hernandez-Diaz
L

Robins
JM

.

Une approche structurelle du biais de sélection

.

Épidémiologie
2004

;

15

:

615

25

.

7

Groenland
S

.

Quantification des biais dans les modèles causaux: Biais de confusion classique vs biais de stratification par collisionneur

.

Épidémiologie
2003

;

14

:

300

06

.

8

Glymour
MM

Groenland
S

.

Diagrammes causaux

. Dans :

Rothman
KJ

Groenland
S

Cils
TL

(eds).

Épidémiologie moderne

. 3e éd.

Philadelphie, Pennsylvanie

:

Lippincott Williams & Wilkins

,

2008

.

9

Pizzi
C

De Stavola
B

Merletti
F

et al. .

Sélection de l’échantillon et validité des estimations de l’association exposition-maladie dans les études de cohorte

.

J Epidemiol Santé communautaire
2011

;

65

:

407

11

.

10

Westreich
D

.

Biais de Berkson, biais de sélection et données manquantes

.

Épidémiologie
2012

;

23

:

159

64

.

11

Groenland
S

.

Perspectives bayésiennes pour la recherche épidémiologique. III. Analyse des biais par des méthodes de données manquantes

.

Int J Epidemiol
2010

;

39

:

1116

16

.

You might also like

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.