Czy istnieje nazwa zjawiska fałszywych trafień, które w sprzeczny z intuicją sposób przewyższają prawdziwe pozytywy?

Roger Heathcote

2019-10-14 16:29:22 UTC

view on stackexchange narkive permalink

Wielu osobom wydaje się bardzo sprzeczne z intuicją, że dany test diagnostyczny z bardzo dużą dokładnością (powiedzmy 99%) może generować znacznie więcej fałszywie dodatnich niż prawdziwie pozytywnych w niektórych sytuacjach, a mianowicie, gdy populacja prawdziwie pozytywnych wyników jest bardzo mała w porównaniu zcała populacja.

Widzę, że ludzie często popełniają ten błąd, np.gdy opowiadam się za szerszymi badaniami zdrowia publicznego lub szerszymi środkami ochrony przed przestępczością itp., ale nie wiem, jak zwięźle opisać błąd, który popełniają ludzie.

Czy to zjawisko / błąd statystyczny ma swoją nazwę?W przeciwnym razie ktoś ma dobrą, zwięzłą, pozbawioną żargonu intuicję / przykład, który pomógłby mi wyjaśnić to laikowi.

Przepraszamy, jeśli to niewłaściwe forum, na którym można o to zadać.Jeśli tak, skieruj mnie do bardziej odpowiedniego.

jako krótki komentarz można by powiedzieć, że scenariusz ma słabą „pozytywną wartość predykcyjną”, co może być kolejną drogą do rozważenia w myśleniu o tym, jak wyjaśnić.

Czy masz na myśli, że test generuje więcej fałszywych trafień niż ogólnie prawdziwie pozytywnych wyników, mimo że jest dokładny w 99% we wszystkich przypadkach, czy też masz na myśli, że dokładnie ten sam test ma inne zachowanie w zależności od podzbioru populacji, o którym mowa?Ponieważ ogólny współczynnik dokładności już sugeruje, że przypadek, w którym ma trudności z identyfikacją prawdziwych pozytywów, jest rzadszym stanem.„Kiedy populacja prawdziwie pozytywnych wyników jest bardzo mała w porównaniu ...” brzmi tak, jakby charakteryzował test obejmujący całe populacje, a nie różnice w jego zachowaniu w porównaniu z subpopulacjami.Czy to jest poprawne?

Obecna odpowiedź podaje ten termin, ale poprosiłeś również o przykład, który mógłby pomóc wyjaśnić to laikowi: Rozważ chorobę, która dotyka 1 na 1000 osób.Wykonując test z dokładnością 99% na 1000 osób, 10 osób jest klasyfikowanych nieprawidłowo.Więc 1 osoba może być prawdziwie pozytywna, ale nadal może być 9 fałszywych trafień.Ogólnie „dokładność” (jako miara) ma sens tylko w przypadku * zrównoważonych * rozkładów.W przeciwnym razie lepszym środkiem może być „poinformowanie”.Więcej przykładów można znaleźć pod adresem https://en.wikipedia.org/wiki/Confusion_matrix#Table_of_confusion.

@pygosceles Tak.Wiele osób, jeśli nie większość, ma intuicję, że test, który jest dokładny w 99% implikuje fałszywie dodatni wskaźnik 1%, niezależnie od liczby prawdziwie pozytywnych wyników w populacji i wielkości populacji.Wielu osobom wydaje się sprzeczne z intuicją, że bardzo dokładny test może w niektórych okolicznościach dać o wiele więcej fałszywych trafień niż prawdziwych pozytywów.

@technicalbloke Wygląda na to, że tak naprawdę nie myślą nawet o prawdziwej wartości dodatniej jako o swojej własnej rzeczy, być może fałszywie łącząc ogromną proporcję prawdziwych wyników ujemnych + prawdziwych negatywów z prawdziwymi pozytywami, ponieważ prawdziwe negatywy decydują o dokładności pomiaru rzadkich warunków, iwięc nie mów nic o prawdziwych i fałszywie pozytywnych wskaźnikach.Lekceważenie fałszywych alarmów brzmi tak, jakby mogły również łączyć dokładność z przywołaniem, dlatego trzeba precyzyjnie uzupełnić ich koncepcję przypomnienia, co wydaje się być sednem twojego zainteresowania.

Zobacz także: [błąd prokuratora] (https://en.wikipedia.org/wiki/Prosecutor%27s_fallacy), co jest tego konsekwencją.

Pan Pi ma najlepszą odpowiedź.Potocznie można by też powiedzieć, że „pozytywne wyniki mają niski stosunek sygnału do szumu”, być może jest bardziej dostępne dla większej populacji (… być może).Ale to jest opis sytuacji niezależnej od intuicyjnych, logicznych błędów. Jest to klasyczny przypadek prawdopodobieństwa Bayesa, który jest wielokrotnie wyrażany w badaniach medycznych lub problemie snajperskim.http://commonsenseatheism.com/?p=13156

Użyj testu na wampiry jako analogii.Jeśli miałeś test, który poprawnie określa, czy ktoś jest wampirem, czy nie, który jest dokładny w 99%, * każdy * wynik pozytywny jest fałszywie pozytywny.Ta analogia podwaja się jako całkiem dokładny test dla ludzi wierzących w wampiry.

Niekoniecznie jest to błąd lub „zła rzecz”.Można to uznać za dobry kompromis między kosztami a korzyściami dla testów _ screeningowych, które są tanimi testami o wyjątkowo wysokiej specyficzności, aby nie przegapić prawdziwych instancji kosztem małej precyzji (wiele fałszywych alarmów).Następnie dla znacznie mniejszej liczby pozytywnych wyników, które mogą mieć wszystkie prawdziwe pozytywne wyniki, użyj droższego drugiego testu, aby wyeliminować wiele fałszywych alarmów.