nie można interpretować wyników testu bez znajomości prawdopodobieństwa wstępnego.
jestem pewien, że wszyscy słyszeliśmy ten sam wykład o testach przesiewowych. Jestem pewien, że wszyscy byliśmy zaskoczeni dziwnymi liczbami wynikającymi z zastosowania pozornie doskonałych testów w populacjach niskiego ryzyka. Jestem pewna, że wszyscy wiemy, że nie powinniśmy stosować testów ciążowych na mężczyznach.
ale te przykłady w klasie są zbyt łatwo zapomniane podczas pracy na pilnych zmianach. Zamawiamy setki testów co godzinę (jeśli weźmiemy pod uwagę każdy test laboratoryjny osobno) i po prostu nie mamy czasu na zmaganie się z formułą Bayesa przy każdym teście.
Matematyka działa bez potwierdzenia, lub ignorujemy wyniki testów (takie jak błędne liczby białych krwinek) bez formalnego uznania bayesowskiego wyjaśnienia, że są one błędne. Ale czasami bardzo się mylimy. Czasami to boli naszych pacjentów.
więc ważne jest, aby pamiętać: nie można interpretować wyników testów bez znajomości prawdopodobieństwa wstępnego.
przykład: badania przesiewowe
najbardziej zaskakujące wyniki tego głównego badania pochodzą z badań przesiewowych. Użyję teoretycznego przykładu zaczerpniętego z doskonałego podręcznika” błędy poznawcze i błędy diagnostyczne ” Jonathana Howarda: (Howard 2019)
wyobraź sobie nowy tomograf komputerowy, który nigdy nie pomija przypadku raka piersi (jest w 100% wrażliwy), ale powoduje fałszywie pozytywny odczyt U 5% zdrowych kobiet (jest specyficzny dla 95%). To fantastyczny test-dokładniejszy niż większość, których używamy. Chcielibyśmy go wykorzystać do wczesnego wykrywania raka piersi, jako część protokołu badań przesiewowych. U kobiet w wieku poniżej 50 lat wskaźnik raka piersi wynosi 1 na 1000. Jeśli Robin, 45-letnia kobieta, ma pozytywny wynik testu, jakie jest prawdopodobieństwo, że ma raka? (Sprawdź się-Zgadnij teraz).
wygląda na to, że Robin ma dość duże szanse na raka. W końcu bardzo dokładny test mówi, że ma raka. Ale Policzmy. W próbie 1000 kobiet spodziewamy się, że 1 z nich ma raka. Tomografia jest idealna i identyfikuje jedną kobietę z rakiem. Jednak wskaźnik fałszywie dodatnich wyników wynoszący 5% oznacza, że spośród tej grupy tysiąca kobiet 50 otrzyma fałszywie dodatnie wyniki. Jest 51 pozytywnych testów i tylko 1 prawdziwy przypadek raka. Dlatego prawdopodobieństwo zachorowania na raka u Robina, pomimo pozytywnej tomografii komputerowej, wynosi 1/51, czyli około 2%.
pozytywny wynik na bardzo dokładnym teście, a jest jeszcze tylko 2% szansa, że pacjent ma chorobę?!
wyniki testów, szczególnie te z zaawansowanych technologicznie testów, takich jak CTs i rezonans magnetyczny, są zbyt często traktowane jako doskonałe. Po prostu akceptujemy wyniki jako „diagnozę”, ale przypadek Robina jest doskonałym przypomnieniem omylności naszych testów. Nawet jeśli CT było 99% specyficzne, prawdopodobieństwo posttest nadal będzie tylko 10%. To zaskakujące. Nie spodziewamy się, że dokładne testy będą mylne częściej niż mają rację.
można argumentować, że 1 na 1000 jest bardzo niskim prawdopodobieństwem wstępnym. W medycynie ratunkowej zajmujemy się pacjentami z objawami o wyższej początkowej częstości występowania chorób. (Niestety, jeśli uważają Państwo, że stosujemy testy warunków skrajnych, myślę, że uznacie to założenie za błędne.) Z tego powodu myślę, że kolejny przykład jest jeszcze bardziej interesujący. Załóżmy, że zastosujemy tę samą tomografię do 70-letniej kobiety, która ma 10% wstępne prawdopodobieństwo choroby. W grupie 1000 pacjentów, teraz 100 pacjentów będzie miało raka piersi, a CT zidentyfikuje ich wszystkich. Spośród 900 zdrowych kobiet, 45 będzie miało pozytywny CTs. Więc wyniki są znacznie lepsze. Jeśli masz pozytywną tomografię komputerową, masz 69% (100/145) szans na zachorowanie na raka. Jednak nawet w scenariuszu z umiarkowanym prawdopodobieństwem wstępnym i bardzo dokładnym testem (znacznie lepszym niż większość z nich stosujemy w medycynie ratunkowej) nadal istnieje 30% szans, że jest to fałszywie pozytywny wynik!
Jak to się ma do medycyny ratunkowej?
testy muszą być interpretowane (lub lepiej jeszcze uporządkowane) po rozważeniu prawdopodobieństwa wstępnego testu.
często słyszę historie o „wielkich połowach”. Lekarzy, którzy zlecili CTPA, pomimo niskiego ryzyka PE i Perc ujemnego. CT jest pozytywne. Doktor szeroko chwali się tym wspaniałym ratunkiem. Mieszkańcy są nauczani o omylności Zasady PERC, a ostatecznie więcej ct są zamawiane.
pewnie widać do czego to zmierza. Policzmy to. Po wykluczeniu odpowiedniej pacjentki przez wynik PERC, ma ona około 1,4% szans na PE. (Kline 2004) angiogram płuc CT jest całkiem dobrym testem, chociaż wcześniej omawiałem dane wykazujące, że radiolodzy często nie zgadzają się co do ostatecznej lektury. (Miller 2015) Najlepsze dane, jakie mamy, prawdopodobnie pochodzą z badania PIOPED II, które wykazało, że CTPA ma czułość 83% i swoistość 96% w porównaniu z tradycyjną angiografią płuc. (Stein 2006) technologia CT zmieniła się od badania PIOPED, a więc czułość jest prawie na pewno lepsza (ale miałem bardzo trudny czas znalezienia nowoczesnego oszacowania). Dla dobra naszych obliczeń, zakładam 95% czułości.
Tak więc, na każde 1000 pacjentów z niskim ryzykiem PERC ujemnym obserwowanych w ED, będzie 14 PEs. Tomografia wykryje 13 z tych 14 pacjentów. U pozostałych 986 pacjentów CT będzie fałszywie dodatni u 39. Dlatego CT będzie dodatni u 52 pacjentów ogółem, ale tylko 13 z tych pacjentów (25%) faktycznie ma PE.
więc kiedy kolega chwali się znalezieniem PE u pacjenta o niskim ryzyku, jest 75% szans, że się myli. Istnieje 75% szansa, że pacjentowi podano niepotrzebne działanie przeciwzakrzepowe. 75% szans, że chociaż CT był fałszywie dodatni, pacjentka będzie spieszyć się do oddziału ratunkowego z powodu bólu w klatce piersiowej lub duszności lub do końca życia, otrzymując o wiele więcej testów (i potencjalnie więcej fałszywie dodatnich). Innymi słowy, istnieje 75% szans, że skrzywdzimy tego pacjenta.
nie można zinterpretować wyników testu bez znajomości prawdopodobieństwa wstępnego.
dotyczy to wszystkich naszych testów. Niezależnie od tego, czy zamawiasz tomografię komputerową, morfologię krwi, prześwietlenie lub EKG. Nie można zinterpretować wyników testu bez znajomości wstępnego prawdopodobieństwa. Próbowanie tego zaszkodzi twoim pacjentom.
Błędy poznawcze i błędy diagnostyczne. : Springer International Publishing.
Kline JA, Mitchell AM, Kabrhel C, Richman PB, Courtney DM. Kryteria kliniczne zapobiegające niepotrzebnym badaniom diagnostycznym u pacjentów poradni ratunkowej z podejrzeniem zatoru płucnego. Journal of thrombosis and haemostasis: JTH. 2004; 2(8):1247-55.
Miller WT, Marinari LA, Barbosa E, et al. Małe wady tętnicy płucnej nie są wiarygodnymi wskaźnikami zatorowości płucnej. Ann Am Thorac Soc. 2015. PMID: 25961445
Stein PD, Fowler SE, Goodman LR, et al. Wielodetektorowa tomografia komputerowa w ostrej zatorowości płucnej. The New England journal of medicine. 2006; 354(22):2317-27.
Zdjęcie Crissy Jarvis na Unsplash