Błąd podstawowego wskaźnika dotyczy specjalizacji w różnych populacjach, co nie obejmuje szerszego błędnego przekonania, że wysoka dokładność oznacza zarówno niski odsetek wyników fałszywie dodatnich, jak i niski.
W rozwiązywaniu zagadki wysokiej dokładności z wysokim odsetkiem fałszywych trafień nie mogę wyjść poza bardzo powierzchowne, faliste i niedokładne wyjaśnienia bez wprowadzania ludzi w pojęcia precyzji i przypominania.
Mówiąc prościej, można po prostu zapisać dwie wartości zainteresowania zamiast nadmiernie uproszczonego wskaźnika „dokładności”:
- Jaka część osób ze schorzeniem X wykazała test? To jest współczynnik przypominania. Nieprawidłowe określenia to fałszywie negatywy - osoby, które powinny zostać zdiagnozowane jako chore, ale tak nie jest.
- Jaka część osób, które według testu mają stan X, faktycznie ma stan X? To jest współczynnik precyzji. Nieprawidłowe określenia tutaj to fałszywe alarmy - ludzie, o których mówiliśmy, mają ten stan, ale nie.
Test diagnostyczny jest przydatny tylko wtedy, gdy dostarcza nowych informacji. Możesz im pokazać, że do diagnozy rzadkich schorzeń (powiedzmy, <1% przypadków), jest trywialnie łatwe skonstruowanie testu, który jest bardzo dokładny (> 99% dokładności!), Jednocześnie mówiąc nam nic, czego jeszcze nie zrobiliśmy wiedzieć, kto go ma, a kto nie: po prostu powiedz wszystkim, że go nie ma. Nieskończona liczba testów ma tę samą dokładność, ale precyzję handluje ich przywołaniem i odwrotnie. Można uzyskać 100% precyzję lub 100% dokładność, nie robiąc nic, ale tylko test rozróżniający zmaksymalizuje oba. W rzeczywistości obliczenia i pokazanie im dokładności i współczynników przypominania mogą ich poinformować i pomóc im w inteligentnym przemyśleniu kompromisów i potrzebie bardziej wnikliwego testu. Łączenie testów, które dostarczają różnych informacji, może prowadzić do dokładniejszej diagnozy, nawet jeśli wynik jednego lub drugiego testu jest sam w sobie niedopuszczalnie niedokładny.
To jest kluczowe: czy test dostarczy nam nowych informacji, czy nie?
Jest jeszcze wymiar niechęci do ryzyka: ile fałszywych trafień warto ponieść, aby znaleźć jeden prawdziwie pozytywny? To znaczy, ile osób jesteś skłonny wprowadzić w błąd, myśląc, że mają coś, czego mogliby nie mieć, aby znaleźć kogoś, kto to ma? Będzie to zależało od niebezpieczeństwa błędnej diagnozy, które zwykle różni się w przypadku fałszywie pozytywnych i fałszywie negatywnych wyników.
Edytuj:
Ponadto korzystny byłby test potwierdzający lub testy, które są coraz dokładniejsze, być może odkładane na później, ponieważ są droższe.Diagnozy z tendencją do fałszywie pozytywnych wyników mogą być zatem używane wspólnie w celu skonstruowania sita, które jest opłacalnym dyskryminatorem, eliminującym większość prawdziwych negatywów na wczesnym etapie.Jednak to również wiąże się ze zwiększonym zagrożeniem dla prawdziwych pozytywów: chcesz, aby pacjenci z rakiem otrzymali leczenie tak szybko, jak to możliwe, i aby przeskoczyli przez trzy lub pięć obręczy, z których każda wymaga od dwóch tygodni do miesiąca wcześniejszego planowania, zanim będą mogliuzyskanie dostępu do leczenia może pogorszyć rokowanie o rząd wielkości.Dlatego pomocne jest wspólne branie pod uwagę innych tańszych testów podczas przeprowadzania segregacji na potrzeby obserwacji w celu ustalenia priorytetów tych pacjentów, którzy mają największe prawdopodobieństwo zachorowania na tę chorobę i wykonywania wielu testów jednocześnie, jeśli to możliwe.