Sesgo de Berkson
En 1984, uno de nosotros (N. P.) vivía en la playa en Nueva Zelanda. Estaba escribiendo mi tesis doctoral, cuando tuve una lesión de fútbol (‘fútbol’) que me dio un grave problema de espalda durante una semana. Después de los primeros dos días de estar tumbado boca arriba escuchando música y sin poder hacer mucho más, me desperté en medio de la noche con náuseas y mareos aparentemente causados por una infección del oído interno. Durante los siguientes cinco días tuve dolor de espalda severo cuando me levanté, náuseas y mareos severos cuando me acosté y una mezcla de los dos cuando me senté en una silla. El propósito de contar esta triste historia no es relacionar mi historia médica con los lectores de IJE, sino más bien porque es relevante para la historia del sesgo de Berkson, que había estado estudiando en ese momento. No ingresé en el hospital, pero estaba cerca, y me dio experiencia de primera mano de cómo «las personas con dos o más enfermedades tienen una mayor probabilidad de ser hospitalizadas que las personas con una sola enfermedad, incluso si estos resultados son independientes».1 Si hubiera sido hospitalizado y reclutado para un estudio de infecciones del oído interno, y si hubiera habido suficientes personas como yo, probablemente habríamos contribuido a una conclusión falsa de que las lesiones de fútbol americano (que causaron mi problema de espalda) eran una causa de infecciones del oído interno,esto corresponde a la forma «indirecta» del sesgo de Berkson, 2 como se muestra en la Figura 3a en el artículo de Snoep et al.1
El sesgo de Berkson (también denominado «falacia de Berkson») es quizás una de las formas de sesgo más conocidas, pero menos bien entendidas. El artículo de Snoep et al.1 aclara cuál es el sesgo, por qué a veces importa, pero por qué generalmente no. Comentaremos tres aspectos del artículo: (i) el uso de Gráficos Acíclicos Dirigidos (DAG); (ii) los componentes del sesgo de Berkson; y (iii) la fuerza y dirección probables de tales sesgos.
Gráficos Acíclicos dirigidos (DAG)
El artículo de Snoep et al. ilustra claramente el poder y la elegancia de los Gráficos Acíclicos Dirigidos (DAG). Lo que antes intentábamos entender usando palabras, probabilidades y ejemplos numéricos, ahora se puede explorar de manera mucho más elegante utilizando diagramas causales. Esto representa un avance real, y aclara muchos aspectos del sesgo de Berkson.
De manera más general, los DAG han aclarado la relación previamente turbia entre el sesgo de selección y la confusión. Tradicionalmente, el sesgo de selección se ha descrito como un sesgo que surge de una selección inadecuada (o autoelección) de los sujetos del estudio de la población de origen.3 En un nivel, esto es suficientemente claro, pero el uso de la palabra «selección» ha llevado a menudo a que el término se aplique a la selección inadecuada de un grupo de comparación,lo que lleva a la confusión en cuanto a si fenómenos como el efecto trabajador sano son ejemplos de bias de selección4 o de confusión,5, 6 La situación se complica aún más porque los determinantes de la selección (por ejemplo, edad, género, posición socioeconómica) pueden convertirse en factores de confusión y controlarse en el análisis, incluso si no lo eran en la población de origen. El uso de DAG aclara esto y distingue entre sesgos resultantes de condicionamiento (inadecuado) sobre efectos comunes («sesgo de colisionador» o «sesgo de selección») y falta de condicionamiento sobre causas comunes de exposición y resultado (confusión).6,7 Los dos fenómenos pueden ocurrir juntos, por ejemplo, cuando condicionamos un colisionador que es el efecto de una causa del resultado en lugar de ser un efecto del resultado en sí. Algunos etiquetarían esto como sesgo de selección,6 otros lo considerarían también un tipo de confusión.8,9
Por lo tanto, aunque los tres términos se usan a veces casi indistintamente, el sesgo de colisionador es el fenómeno más general que involucra el condicionamiento de efectos comunes (aunque Hernan et al.6 use el término ‘sesgo de selección’ para este fenómeno más general); el sesgo de selección es entonces un tipo particular de sesgo de colisionador en el que el efecto común es la selección en el estudio; El sesgo de Berkson es entonces un tipo particular de bias10 de selección en el que la selección de casos en el estudio depende de la hospitalización, y la exposición es otra enfermedad, o una causa de otra enfermedad, que también resulta en hospitalización. Es poco probable que esto se hubiera aclarado tan fácilmente sin el uso de DAG.
Los componentes del sesgo de Berkson
En su esencia, el sesgo de Berkson puede ser visto como una estimación sesgada de las probabilidades de exposición entre los casos, ya que los casos expuestos se identifican con mayor probabilidad que los no expuestos, cuando la tasa de hospitalización de los casos es inferior al 100% y la exposición es otra enfermedad, o una causa de otra enfermedad, que resulta en hospitalización. Es posible ilustrar con ejemplos numéricos los diferentes pasos involucrados en el sesgo de Berkson. Comencemos con la población reportada en la Tabla 5 del artículo de Berkson2, donde el odds ratio es de 1,0 (Tabla 1).
Asociación en la población general según lo informado en Berkson2
. | Expuesto . | Sin exponer . | Total . |
---|---|---|---|
Cases | 3000 | 97 000 | 100 000 |
Non-cases | 297 000 | 9 603 000 | 9 900 000 |
Total | 300 000 | 9 700 000 | 10 000 000 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
los Casos | 3000 | 97 000 | 100 000 |
No de los casos | 297 000 | 9 603 000 | 9 900 000 |
Total | 300 000 | 9 700 000 | 10 000 000 |
Odds ratio = 1.0.
Asociación en la población general según lo informado en Berkson2
. | Expuesto . | Unexposed . | Total . |
---|---|---|---|
Cases | 3000 | 97 000 | 100 000 |
Non-cases | 297 000 | 9 603 000 | 9 900 000 |
Total | 300 000 | 9 700 000 | 10 000 000 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
los Casos | 3000 | 97 000 | 100 000 |
No de los casos | 297 000 | 9 603 000 | 9 900 000 |
Total | 300 000 | 9 700 000 | 10 000 000 |
Odds ratio = 1.0.
Ahora asumimos que el estudio compara los casos hospitalizados con los controles de la población general (correspondiente a la Figura 1b de Snoep et al.1). Utilizamos las mismas probabilidades de hospitalización para la Enfermedad 1 (la exposición-0,15) y la Enfermedad 2 (los casos—0,05) del artículo de Berkson. También asumimos (a diferencia de Berkson2 y de Snoep et al.1) que toda la población tiene una prevalencia de 0,2 y una tasa de hospitalización de 0,025 para cualquier otra enfermedad que no sea D1 y D2 (estos supuestos diferentes significan que nuestros números son ligeramente diferentes de los de Berkson2 y Snoep et al.1). Si el estudio compara los casos hospitalizados con los controles de la población general muestreados de no casos con una fracción de muestreo del 10%, los hallazgos correspondientes se muestran en la Tabla 2. La razón de probabilidades estimada es ahora de 3,59, debido a las mayores probabilidades de exposición en los casos hospitalizados (en comparación con todos los casos). Esto es causado por el sesgo del colisionador, como se muestra en la Figura 1b de Snoep et al.1
Asociación con casos hospitalizados y controles de población general
. | Expuesto . | Sin exponer . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 29 700 | 960 300 | 990 000 |
Total | 30 290 | 965 611 | 995 901 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Los Casos | 590 | 5311 | 5901 |
Controles | 29 700 | 960 300 | 990 000 |
Total | 30 290 | 965 611 | 995 901 |
Odds ratio = 3.59.
Asociación con casos hospitalizados y controles de población general
. | Expuesto . | Unexposed . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 29 700 | 960 300 | 990 000 |
Total | 30 290 | 965 611 | 995 901 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Los Casos | 590 | 5311 | 5901 |
Controles | 29 700 | 960 300 | 990 000 |
Total | 30 290 | 965 611 | 995 901 |
Odds ratio = 3.59.
Los hallazgos correspondientes de un estudio realizado entre pacientes hospitalizados de la misma población se muestran en la Tabla 3. El sesgo está ahora en la dirección opuesta, porque el aumento de las probabilidades de exposición en los casos (en comparación con todos los casos) se compensa con creces con un aumento aún mayor de las probabilidades de exposición en los no casos (en comparación con la población general). Esto es nuevamente causado por el sesgo del colisionador, como se muestra en la Figura 1a de Snoep et al.1
Asociación con casos hospitalizados y controles de pacientes hospitalizados por cualquier enfermedad, con prevalencia poblacional de 0,2 y 0.025 probabilidad de hospitalización por cualquier enfermedad distinta de D1 (exposición) o D2 (casos)
. | Expuesto . | Sin exponer . | Total . |
---|---|---|---|
Los Casos | 590 | 5311 | 5901 |
Controles | 45 812 | 48 015 | 93 827 |
Total | 46 402 | 53 326 | 99 728 |
. | Expuesto . | Sin exponer . | Total . |
---|---|---|---|
Los Casos | 590 | 5311 | 5901 |
Controles | 45 812 | 48 015 | 93 827 |
Total | 46 402 | 53 326 | 99 728 |
Odds ratio = 0.12.
Asociación con casos hospitalizados y controles de pacientes hospitalizados por cualquier enfermedad, con un 0.2 prevalencia poblacional y una probabilidad de hospitalización de 0,025 por cualquier enfermedad que no sea D1 (exposición) o D2 (casos)
. | Expuesto . | Sin exponer . | Total . |
---|---|---|---|
Los Casos | 590 | 5311 | 5901 |
Controles | 45 812 | 48 015 | 93 827 |
Total | 46 402 | 53 326 | 99 728 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 45 812 | 48 015 | 93 827 |
Total | 46 402 | 53 326 | 99 728 |
Odds ratio = 0.12.
La tabla 4 muestra un ejemplo más similar al de Berkson2,en el que se ha elegido una enfermedad en particular para la selección de los controles y la enfermedad de control tiene una probabilidad de hospitalización de 0,20 y una prevalencia de 0,005; la odds ratio es ahora de 2,26 y el sesgo está ahora en la dirección opuesta a la Tabla 3, porque la tasa de hospitalización para la enfermedad de control es mayor que la tasa de hospitalización para la enfermedad de caso (y, por lo tanto, el aumento de la exposición es mayor en los casos que en los controles).
Asociación mediante controles hospitalizados con una enfermedad en particular, con una prevalencia poblacional de 0,005 y una probabilidad de hospitalización de 0,20 para la enfermedad control
. | Expuesto . | Sin exponer . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 480 | 9757 | 10 237 |
Total | 1070 | 15 068 | 16 138 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Los Casos | 590 | 5311 | 5901 |
Controles | 480 | 9757 | 10 237 |
Total | 1070 | 15 068 | 16 138 |
Odds ratio = 2.26.
Asociación con controles hospitalizados por una enfermedad en particular, con prevalencia poblacional de 0,005 y 0.20 probability of hospitalization for the control disease
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Cases | 590 | 5311 | 5901 |
Controls | 480 | 9757 | 10 237 |
Total | 1070 | 15 068 | 16 138 |
. | Exposed . | Unexposed . | Total . |
---|---|---|---|
Los Casos | 590 | 5311 | 5901 |
Controles | 480 | 9757 | 10 237 |
Total | 1070 | 15 068 | 16 138 |
Odds ratio = 2.26.
Por lo tanto, cuando se utilizan controles de la población general, el sesgo de Berkson tenderá a producir coeficientes de probabilidades elevados (cuando la tasa de hospitalización para la enfermedad del caso es inferior al 100%); cuando se utilizan controles hospitalarios, el sesgo puede ser en cualquier dirección.
La fuerza y dirección del sesgo
El artículo de Snoep et al. no solo aclara estos mecanismos subyacentes del sesgo de Berkson, sino que también proporciona estimaciones de su fuerza y dirección en una variedad de circunstancias (ver Snoep et al., Cuadro 31). Esto revela que, cuando Berkson construyó un escenario similar a la Tabla 4 en el que la tasa de hospitalización en la enfermedad control (errores refractivos) fue considerablemente mayor que en el caso de la enfermedad (diabetes)-0,2 en comparación con 0.05 – los odds ratio estaban fuertemente sesgados hacia arriba (línea 1 de Snoep et al., tabla 31); cuando la tasa de hospitalización es menor en la enfermedad de control, la odds ratio está sesgada hacia abajo (líneas 4-5 en la Tabla 3 de Snoep et al.1), mientras que no hay sesgo cuando la tasa de hospitalización es la misma para las dos enfermedades y los pacientes que tienen tanto el caso como la enfermedad de control se cuentan solo como casos (líneas 8-9, Tabla 3 de Snoep et al.1).
Así que el sesgo de Berkson puede ocurrir, pero ¿realmente importa? Como Snoep et al.1 nota, el ejemplo de Berkson se basó en un estudio hipotético que involucraba la asociación entre los casos prevalentes y otra enfermedad prevalente (la exposición). Cuando la exposición no es una razón directa para la hospitalización en sí misma, solo la forma indirecta del sesgo de Berkson es relevante, como el ejemplo sobre el problema de espalda causado por una lesión de fútbol americano (ver más arriba). Este sesgo se atenúa en gran medida mediante el uso de casos incidentes y se puede prevenir por completo excluyendo los casos que fueron hospitalizados debido a otra enfermedad. Esto se puede ver en el ejemplo descrito anteriormente: muchas personas con infecciones incidentales del oído medio tendrían que ser hospitalizadas por lesiones concurrentes de fútbol para que ocurriera un sesgo material. Por lo tanto, en muchas (o quizás en la mayoría) situaciones plausibles, el sesgo será extremadamente pequeño, particularmente si se usan casos incidentes. Aunque es teóricamente interesante, en la práctica ha sido en gran medida «mucho ruido y pocas nueces».
Quizás el mensaje principal aquí es que no es suficiente simplemente demostrar que podría ocurrir un sesgo; también es necesario evaluar la probabilidad de que ocurra, y su fuerza y dirección probables. Los estudios epidemiológicos se critican con frecuencia por el potencial de sesgo de información o confusión residual. En algunos casos, estos problemas potenciales son reales e importantes; en otros, son triviales. Los métodos bayesianos están cada vez más disponibles para evaluar la fuerza y la dirección probables de tales sesgos.11
Lo que nos lleva a las limitaciones de los DAG. El artículo de Berkson produjo resultados extremos porque se basó en casos prevalentes, una situación que no puede ser fácilmente representada por los DAG. Si cambiamos de casos prevalentes a casos incidentes, todos los DAG de las figuras 1-6 en Snoep et al.1 todavía se ven iguales, pero los sesgos generalmente se han vuelto triviales. Esto ilustra un problema más general de los DAG: pueden mostrar que podría ocurrir un sesgo, pero no proporcionan estimaciones de su fuerza y dirección probables. Sin esto, es fácil sucumbir a la «parálisis de análisis» que se deriva del miedo a adaptarse a un posible confundidor (que también podría ser un colisionador en otro camino) porque hacerlo podría resultar en un sesgo de colisionador («ansiedad de colisionador»). En algunas situaciones, el sesgo del colisionador puede ser comparable en tamaño con la confusión incontrolada.7 En otros, no lo hará, y el beneficio de controlar la confusión superará con creces los efectos del sesgo del colisionador. Todo depende.
Financiación
El Centro de investigación en Salud Pública recibe el apoyo de una Subvención del Programa del Consejo de Investigación Sanitaria de Nueva Zelandia.
Agradecimientos
Agradecemos a Jan Vandenbroucke sus comentarios sobre el borrador del manuscrito.
Conflicto de intereses: No declarado.
.
.
;
:
–
.
.
.
;
:
–
.
.
. En:
(eds).
. 3rd edn.
:
,
.
.
.
:
,
.
.
. 2nd edn.
:
,
.
.
.
;
:
–
.
.
.
;
:
–
.
.
. En:
(eds).
. 3rd edn.
:
,
.
et al. .
.
;
:
–
.
.
.
;
:
–
.
.
.
;
:
–
.