해설:3 개의 세계 충돌:버크슨의 편견,선택 편견 및 충돌기 편견

버크슨의 편견

1984 년 우리 중 한 명이 뉴질랜드의 해변에 살고있었습니다. 나는 축구(‘축구’)부상을 입었을 때 박사 학위 논문을 쓰고 있었는데,일주일 동안 심각한 허리 문제를 일으켰습니다. 음악을 듣고 많은 다른 일을 할 수 없다는 내 뒤에 주위에 거짓말의 처음 두 일 후,나는 메스꺼움과 현기증이 분명히 내이 감염에 의한 한밤중에 일어났다. 다음 5 일 동안 나는 일어 섰을 때 심한 허리 통증,누워있을 때 심한 메스꺼움과 현기증,그리고 의자에 앉았을 때 두 가지가 섞여있었습니다. 이 미안한 이야기를 이야기하는 목적은 나의 병력을 이제의 독자들과 관련시키기 위한 것이 아니라,오히려 내가 당시에 공부했던 버크슨의 편견에 대한 이야기와 관련이 있기 때문이다. 나는 병원에 입원하지 않았다,하지만 가까운 일이었다,그것은 나에게’두 개 이상의 질병을 가진 사람이 하나의 질병을 가진 사람보다 입원 할 확률이 높은 방법을 직접 경험했다-이러한 결과는 독립적 인 경우에도’.1 만약 내가 병원에 입원하여 내이 감염 연구를 위해 모집 되었다면,그리고 나와 같은 다른 사람들이 충분했다면,우리는 아마도 축구 부상(허리 문제를 일으킨)이 내이 감염의 원인이라는 잘못된 결론에 기여했을 것입니다.1

버크슨의 편견(‘버크슨의 오류’라고도 함)은 아마도 가장 잘 알려져 있지만 가장 잘 이해되지 않는 편견의 형태 중 하나 일 것입니다. 스노 엡 등의 알에 의해 종이.우리는 논문의 세 가지 측면에 대해 언급 할 것입니다:(1)지시 된 비순환 그래프의 사용(다그);(2)버크슨의 편견의 구성 요소;그리고(3)그러한 편견의 가능성있는 강도와 방향.

지시된 비순환 그래프(다그)

스노엡 등의 논문. 지시 된 비순환 그래프(다그)의 힘과 우아함을 명확하게 보여줍니다. 이전에 단어,확률 및 숫자 예제를 사용하여 이해하려고 시도한 것은 이제 인과 관계 다이어그램을 사용하여 훨씬 더 우아하게 탐색 할 수 있습니다. 이것은 진정한 진보를 나타내며 버크슨의 편견의 여러 측면을 명확히합니다.

보다 일반적으로,다그는 선택 편향과 혼란 사이의 이전에 어두운 관계를 명확히했다. 전통적으로 선택 편향은 소스 모집단에서 연구 대상의 부적절한 선택(또는 자기 선택)으로 인해 발생하는 편향으로 설명되었습니다.3 한 수준에서 이것은 충분히 명확하지만,’선택’이라는 단어의 사용은 종종 비교 그룹의 부적절한 선택에 용어를 적용하게하여 건강한 근로자 효과와 같은 현상이 선택 비아 4 의 예인지 또는 혼란의 예인지에 대한 혼란을 야기한다.,5,6 선택의 결정 요인(예:연령,성별,사회 경제적 위치)이 소스 집단에서 혼란스럽지 않더라도 효과적으로 혼란이 될 수 있고 분석에서 통제 될 수 있기 때문에 상황은 더욱 복잡하다. 다그의 사용은이를 명확히하고 일반적인 효과(‘충돌기 편향’또는’선택 편향’)에 대한(부적절한)컨디셔닝으로 인한 편향과 노출 및 결과의 일반적인 원인에 대한 컨디셔닝 부족(혼란)을 구분합니다.6,7 두 가지 현상이 함께 발생할 수 있습니다(예:결과 자체의 효과보다는 결과 원인의 효과 인 충돌기를 조건화할 때). 어떤 사람들은 이것을 선택 편향으로 표시 할 것이고,6 명의 다른 사람들은 그것을 혼란의 한 유형으로 간주 할 것입니다.8,9

따라서,3 개의 용어가 때때로 거의 같은 의미로 사용되지만,충돌기 바이어스는 일반적인 효과에 대한 컨디셔닝을 포함하는 보다 일반적인 현상이다(비록 에르난 외.선택 바이어스는 일반적인 효과가 연구로의 선택 인 특정 유형의 충돌기 바이어스입니다; 버크슨의 편견은 연구에 대한 사례의 선택이 입원에 달려 있고,노출은 또 다른 질병이거나 또 다른 질병의 원인이며,이는 또한 입원을 초래합니다. 이 때문에 쉽게 다그를 사용하지 않고 명확히되었을 것 같지는 않다.

버크슨의 편견의 구성 요소

버크슨의 편견은 노출 된 사례가 노출되지 않은 사례보다 더 큰 확률로 식별되기 때문에 사례의 입원 비율이 100%미만이고 노출이 다른 질병 또는 입원을 초래하는 다른 질병의 원인 인 경우 사례 중 노출 확률에 대한 편향된 추정으로 볼 수 있습니다. 버크슨의 편견에 관련된 여러 단계를 수치적인 예제로 설명 할 수 있습니다. 버크슨 논문의 표 5 에 보고된 인구부터 시작합시다 2 승산비가 1.0 인 경우(표 1).

표 1.

버크슨 2 에서보고 된 일반 인구 협회

. 노출. 노출되지 않음. 합계.
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
사례 3000 97 000 100 000
비 케이스 297 000 9 603 000 9 900 000
전체 300 000 9 700 000 10 000 000

승산 비율=1.0.

표 1.

버크슨 2 에서보고 된 일반 인구 협회

. 노출. Unexposed . Total .
Cases 3000 97 000 100 000
Non-cases 297 000 9 603 000 9 900 000
Total 300 000 9 700 000 10 000 000
. Exposed . Unexposed . Total .
사례 3000 97 000 100 000
비 케이스 297 000 9 603 000 9 900 000
전체 300 000 9 700 000 10 000 000

승산 비율=1.0.

우리는 이제이 연구가 입원 사례를 일반 인구 대조군과 비교한다고 가정합니다(그림 1 에 해당).1). 우리는 버크슨 논문의 질병 1(노출—0.15)과 질병 2(사례—0.05)에 대해 동일한 입원 확률을 사용합니다. 우리는 또한(버크슨 2 와 스노 엡 등과는 다르게)가정한다.1)전체 인구의 유병률이 0.2 이고 입원 율이 0.025 보다 다른 질병에 대해 디 1 과 디 2(이러한 다른 가정은 우리의 숫자가 버크 슨 2 과 스노 엡 등의 숫자와 약간 다르다는 것을 의미합니다.1). 이 연구가 입원 사례를 샘플링 비율이 10%인 비 사례에서 샘플링 된 일반 인구 대조군과 비교하면 해당 결과가 표 2 에 나와 있습니다. 추정 된 확률 비율 때문에(모든 경우에 비해)입원 경우에 더 높은 노출 확률의,지금 3.59 입니다. 이는 도 1 에 도시된 바와 같이 콜라이더 바이어스에 의해 야기된다.1

표 2.

입원 사례 및 일반 인구 통제를 사용한 협회

. 노출. 노출되지 않음. Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
사례 590 5311 5901
컨트롤 29 700 960 300 990 000
전체 30 290 965 611 995 901

승산비=3.59.

표 2.

입원 사례 및 일반 인구 통제를 사용한 협회

. 노출. Unexposed . Total .
Cases 590 5311 5901
Controls 29 700 960 300 990 000
Total 30 290 965 611 995 901
. Exposed . Unexposed . Total .
사례 590 5311 5901
컨트롤 29 700 960 300 990 000
전체 30 290 965 611 995 901

승산비=3.59.

동일한 인구에 있는 입원하게 된 환자 중 실행된 학문에서 대응 발견은 도표 3 에서 보입니다. (모든 경우에 비해)경우에 노출 확률의 증가(일반 인구에 비해)이 아닌 경우에 노출 확률의 더 큰 증가에 의해 상쇄보다 더 있기 때문에 바이어스는 반대 방향으로 지금이다. 이것은 다시 콜라이더 바이어스에 의해 야기된다.1

표 3.

0.2 인구 유병률과 0 으로 모든 질병에 입원 한 환자의 입원 사례 및 통제를 사용하는 협회.025 디 1(노출)또는 디 2(사례)이외의 질병에 대한 입원 확률)

. 노출. 노출되지 않음. 합계.
사례 590 5311 5901
컨트롤 45 812 48 015 93 827
전체 46 402 53 326 99 728
. 노출. 노출되지 않음. 합계.
사례 590 5311 5901
컨트롤 45 812 48 015 93 827
전체 46 402 53 326 99 728

승산비=0.12.

표 3.

어떤 질병으로 입원 한 환자의 입원 사례 및 대조군을 사용하는 협회.2 인구 유병률 및 기타 질병에 대한 입원 확률 0.025 디 1(노출)또는 디 2(사례)

. 노출. 노출되지 않음. 합계.
사례 590 5311 5901
컨트롤 45 812 48 015 93 827
전체 46 402 53 326 99 728
. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 45 812 48 015 93 827
Total 46 402 53 326 99 728

Odds ratio = 0.12.

표 4 는 버크슨의 그것과 더 유사한 예를 보여 주며,2 에서 대조군의 선택을 위해 하나의 특정 질병이 선택되었고 대조군의 질병은 입원 확률이 0.20 이고 유병률은 0.005;승산비는 현재 2.26 이고,대조군의 질병에 대한 입원 비율이 사례 질병에 대한 입원 비율보다 크기 때문에 편향은 이제 표 3 과 반대 방향에있다(따라서 노출의 증가는 대조군보다 경우에 더 크다).

표 4.

0.005 인구 유병률 및 0.20 대조군에 대한 입원 확률로 특정 질병으로 입원 한 대조군을 사용하는 협회

. 노출. 노출되지 않음. 합계.
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
사례 590 5311 5901
컨트롤 480 9757 10 237
전체 1070 15 068 16 138

승산비=2.26.

표 4.

특정 질병으로 입원 한 대조군을 사용하는 협회,0.005 인구 유병률 및 0.20 probability of hospitalization for the control disease

. Exposed . Unexposed . Total .
Cases 590 5311 5901
Controls 480 9757 10 237
Total 1070 15 068 16 138
. Exposed . Unexposed . Total .
사례 590 5311 5901
컨트롤 480 9757 10 237
전체 1070 15 068 16 138

승산비=2.26.

따라서 일반 인구 통제를 사용할 때 버크슨의 편견은 상승 된 승산비를 생성하는 경향이 있습니다(사례 질병에 대한 입원 율이 100%미만인 경우); 병원 컨트롤을 사용할 때 바이어스는 어느 방향 으로든 될 수 있습니다.

바이어스의 강도 및 방향

스노엡 등에 의한 논문. 뿐만 아니라 버크슨의 편견의 이러한 기본 메커니즘을 명확히;또한 다양한 상황에서 그 강도와 방향의 추정치를 제공합니다(스노 엡 외.참조).,표 31). 이것은 버크슨이 대조 질환(굴절 이상)의 입원 비율이 0 에 비해 케이스 질환(당뇨병)-0.2 보다 상당히 높은 표 4 와 유사한 시나리오를 구축했을 때 나타났습니다.05-승산비가 강하게 위쪽으로 편향되었다(스노 엡 등의 1 호선.(표 31);대조군 질환에서 입원율이 낮은 경우,승산비는 아래쪽으로 편향된다(스노엡 외 표 3 의 라인 4-5).1),입원률이 두 질환에 대해 동일할 때 편견이 없는 반면,사례와 대조 질환이 둘 다 있는 환자는 사례로만 계산된다(행 8-9,스노엡 외 표 3).1).

그래서 버크슨의 편견은 확실히 발생할 수 있지만 정말로 중요합니까? 스노 엡 등으로.1 참고,버크슨의 예는 널리 퍼진 사례와 다른 널리 퍼진 질병(노출)사이의 연관성을 포함하는 가상의 연구를 기반으로했습니다. 노출 자체가 입원의 직접적인 이유가 아닌 경우,축구 부상으로 인한 등 문제에 대한 예와 같이 버크슨의 편견의 간접적 인 형태 만 관련이 있습니다(위 참조). 이 편견은 사고 사례를 사용하여 크게 약화되며 다른 질병으로 인해 입원 한 사례를 제외함으로써 완전히 예방할 수 있습니다. 이것은 위에서 설명한 예에서 볼 수 있습니다—사고 중이 감염이있는 많은 사람들이 물질적 편견이 발생하기 위해 동시 축구 부상을 입기 위해 입원해야합니다. 따라서 많은(또는 아마도 가장)그럴듯한 상황에서,특히 사고 사례가 사용되는 경우 편향은 매우 작을 것입니다. 이론적으로는 흥미롭지 만 실제로는’아무것도 아닌 것에 대해 많은 고뇌’였습니다.

아마도 여기서 주요 메시지는 편견이 발생할 수 있음을 보여주는 것만으로는 충분하지 않다는 것입니다; 또한 그것이 발생할 가능성과 그 가능성있는 강도와 방향을 평가할 필요가 있습니다. 역학 연구는 자주 정보 바이어스 또는 잔여 혼란에 대 한 가능성에 근거 하 여 비판. 어떤 경우에 이러한 잠재적인 문제는 진짜 중요 한;다른 사람에 그들은 사소한. 베이지안 방법은 그러한 편견의 가능성있는 강도와 방향을 평가하기 위해 점점 더 이용 가능 해지고 있습니다.11

이는 우리에게 다그의 한계를 가져온다. 버크슨의 논문은 널리 퍼진 사례에 근거했기 때문에 극단적 인 결과를 낳았다. 우리는 사건의 경우에 널리 퍼진 사례에서 변경하는 경우,도 1-6 의 다그의 모든 스노 엡 등의 알.(1)는 여전히 같은 보이지만,편견은 일반적으로 사소한되고있다. 이 개그의보다 일반적인 문제를 보여—그들은 편견이 발생할 수 있음을 표시 할 수 있습니다,하지만 가능성이 강도와 방향의 추정치를 제공하지 않습니다. 이것이 없으면 충돌기 편향(‘충돌기 불안’)이 발생할 수 있기 때문에 잠재적 인 혼란자(다른 경로의 충돌기 일 수도 있음)에 대한 조정에 대한 두려움에서 비롯된’분석 마비’에 굴복하기 쉽습니다. 일부 상황에서 충돌기 바이어스는 통제되지 않은 혼란과 크기가 비슷할 수 있습니다.7 다른 사람들은 그렇지 않을 것이며,혼란을 통제함으로써 얻는 이익은 충돌기 편향의 효과보다 훨씬 클 것입니다. 그것은 모두 달려 있습니다.

기금

공중 보건 연구 센터는 뉴질랜드 보건 연구위원회의 프로그램 보조금으로 지원됩니다.

감사

원고 초안에 대한 얀 반덴 브루케의 의견에 감사드립니다.

이해 상충:선언되지 않음.

1

모라비아

에르난데스 디아즈
에스

에르난
엄마

일본

.

버크슨의 오류에 대한 구조적 접근:그리고 그것에 대한 의견의 역사에 대한 가이드

.

2014

;

43

:

515

21

.

2

버크슨
제이

.

병원 데이터

에 대한 4 중 테이블 분석 적용의 한계.

생체 인식 황소
1946

;

2

:

47

53

.

2014 년 재 인쇄;;43:511-15.

3

로스만

그린란드
에스

래쉬

.

역학 연구의 유효성

. 에서:

로스

그린란드
에스

(8189>

).

현대 역학

. 2018 년 11 월

필라델피아,펜실바니아

:

리핀 코트 윌리엄스&윌킨스

,

2008

.

4

시간

피어스

크로포드 브라운

.

직업 역학의 연구 방법

.

뉴욕

:

옥스포드 대학 출판부

,

1989

.

5

시간

피어스

.

직업 역학의 연구 방법

. 두 번째 에드.

뉴욕

:

옥스포드 대학 출판부

,

2004

.

6

에르난
엄마

에르난데스 디아즈
에스

울새
제이미

.

선택 편향에 대한 구조적 접근

.

역학
2004

;

15

:

615

25

.

7

그린란드
에스

.

인과 모델의 편향 정량화:고전적 혼란 대 충돌기-계층화 편향

.

역학
2003

;

14

:

300

06

.

8

글리모어

그린란드
에스

.

인과 다이어그램

. 에서:

로스

그린란드
에스

(8189>

).

현대 역학

. 2018 년 11 월

필라델피아,펜실바니아

:

리핀 코트 윌리엄스&윌킨스

,

2008

.

9

팩스:86-755-8211000

스타볼라

또한,상기 제제들은 상기 제제들에 의해 제조된다. .

코호트 연구에서 노출-질병 연관 추정치의 샘플 선택 및 유효성

.

제 역학공동체 보건
2011

;

65

:

407

11

.

10

.

버크슨의 편향,선택 편향 및 누락 된 데이터

.

역학
2012

;

23

:

159

64

.

11

그린란드
에스

.

역학적 연구를 위한 베이지안 관점. 누락 된 데이터 방법을 통한 바이어스 분석

.

2010

;

39

:

1116

16

.

You might also like

답글 남기기

이메일 주소는 공개되지 않습니다.