Pytanie:
Podziały w statystykach
Stijn
2011-12-30 16:28:34 UTC
view on stackexchange narkive permalink

Jakiś czas temu rozmawiałem z profesorem statystyki na temat różnych „smaków” statystyki (częsty, bayesowski, ...). Stwierdził, że podzieli statystyki na cztery kategorie: statystykę nieparametryczną, niezawodną, ​​częstą i bayesowską. Podział ten charakteryzuje się ilością założeń, jakie metody przyjmują w odniesieniu do leżących u podstaw rozkładów (statystyka nieparametryczna nie czyni żadnego, podczas gdy metoda bayesowska czyni te założenia bardzo jednoznacznymi).

Chciałem zapytać, czy CrossValidated zgadza się z tym podziałem, ale ponieważ jest to subiektywne pytanie, zadam:

1) Czy ten podział jest szeroko rozpoznawany w statystykach;

2) Czy problem „w świecie rzeczywistym” wymaga zwykle jednej konkretnej metody? To znaczy, biorąc pod uwagę jakiś problem, czy istnieje metoda najbardziej odpowiednia do rozwiązania tego problemu, czy też wiele metod może działać w przypadku danego problemu?

Z góry dziękuję.

Podpodziały w statystykach CrossValidated nie są dobre dla społeczności. Ludzie zawsze mylą jego problem z tym, jaki to jest problem. Problem Statystyka powinien być otwarty dla każdego, kto interesuje się statystyką. Poza tym podziały ta społeczność nie przynosi żadnych korzyści.
Nie zgadzam się, że stosując metody statystyczne, trzeba mieć jasność co do ram, w jakich przeprowadzana jest analiza, a nie można tego zrobić bez wspominania o podziale statystyki na co najmniej dwie zasadniczo różne kategorie (bayesowskie i często). Jednak wszyscy powinniśmy znać oba frameworki, aby wiedzieć, który jest bardziej odpowiedni dla danej aplikacji. Zrozumienie podziału jest niezbędne, więc dyskusja jest pomocna. To, co nie jest pomocne, to sztywne trzymanie się tylko jednego podziału i ignorowanie korzyści z drugiego.
Funkcja tagów wystarczy nam do rozróżnienia kategorii problemów. Jeśli podział jest konieczny, dlaczego nie podzielimy wymiany stosów matematycznych na matematykę stosowaną lub czystą matematykę? Podział może wpływać na architekturę systemu wymiany stosów. Potrzebne są zasoby do aktualizacji systemu. Nie jest łatwo podjąć decyzję. Jedną rzeczą, którą należy zrobić, jest przeanalizowanie powiązanych danych systemowych, czy społeczność statystyki jest oddzielona, ​​czy nie.
Nie sądzę, by ktokolwiek sugerował podział na podziały poddane walidacji krzyżowej, po prostu omówienie podziału statystyk.
Wydaje mi się, że chcemy nowego tagu: „szkoły myśli”, „ogólny obraz” lub „różne podejścia”, ale szczerze mówiąc, żadna z moich propozycji nie jest dla mnie zbyt ważna.
@MichaelBishop, może zrobi coś w rodzaju „filozofii statystyki”?
Na pewno jest miejsce na jakąś taksonomię tego pola. Niestety, większość wymienionych terminów ma tak wiele znaczeń, że lepiej byłoby ich nie używać, ale raczej sklasyfikować jawne założenia i filozofie wokół.
Dwa odpowiedzi:
Dikran Marsupial
2011-12-30 17:10:18 UTC
view on stackexchange narkive permalink

Nie uważałbym nieparametrycznych lub niezawodnych za podkategorie statystyk w taki sposób, jak często i bayesowskie, po prostu dlatego, że istnieją metody częstościowe i bayesowskie dla nieparametrycznych i solidnych statystyk. Frequentist i Bayesian to autentyczne podkategorie, ponieważ opierają się na zasadniczo różnych definicjach prawdopodobieństwa. Frequentists i bayesians będą różnicować siłę przyjętych założeń w zależności od wymagań aplikacji.

Powiedziałbym więc, że dany podział na cztery kategorie nie jest powszechnie uznawany w statystykach. Moim zdaniem do większości problemów statystycznych można zastosować zarówno metodę bayesowską, jak i częstą, jednak nie zawsze są one równie przydatne, na przykład to, czy bardziej odpowiedni jest częsty przedział ufności, czy wiarygodny przedział bayesowski, zależy od tego, czy chcemy zadać pytanie o czego się spodziewać, jeśli eksperyment zostanie powtórzony, lub czego możemy wywnioskować o statystykach w wyniku konkretnego eksperymentu, który faktycznie przeprowadziliśmy (sugerowałbym w większości przypadków to drugie, ale naukowcy i tak na ogół używają metod częstych).

Jedną z rzeczy, o których myślę, że zasugerowałeś, ale które warto rozwinąć dalej, jest to, że znaczna część „rozgraniczenia” między statystyką bayesowską a częstoistyczną leży w motywacji, interpretacji i filozofii. Istnieje wiele przypadków, w których (a) to samo dokładne podejście formalne można podać argument bayesowski lub często (np. Regresja grzbietowa) i / lub (b) tak zwane metody bayesowskie lub częste prowadzą do tego samego rozwiązania, chociaż końcowe interpretacje różnią się (np. pewne ufności / wiarygodne konstrukcje przedziałów).
tak, absolutnie (+1). Różnice między frameworkami uważam za bardzo interesujący temat. Mój podstawowy pogląd jest taki, że powinieneś przyjąć ramy, które najbardziej bezpośrednio odpowiadają na pytanie, które chcesz zadać (dokładne sformułowanie pytania jest bardzo ważne!), Co często jest kwestią interpretacji / znaczenia. Jednak, podobnie jak wielu, często używam metod częstych, gdy nie są one do końca odpowiednie, ponieważ podejście bayesowskie obejmuje całki, które są po prostu zbyt trudne. Umiejętność polega na tym, aby wiedzieć, kiedy jest OK. zadowolić się „złym” podejściem, a kiedy tak nie jest, co wcale nie jest łatwe!
@DikranMarsupial, dzięki za odpowiedź. Podobnie jak ty, uważam, że różnice między frameworkami i implikacje używania jednego z nich są naprawdę interesujące. Czy znasz jakieś książki na ten temat?
Przepraszam, nie znam żadnych dobrych książek na ten temat; Za najbardziej pouczające źródło znalazłem dyskusje na Stack Exchange (i ze współpracownikami).
Fomite
2011-12-31 03:56:18 UTC
view on stackexchange narkive permalink

Niekoniecznie bym twierdził, że te są to podziały obecne w statystykach. Pod naciskiem argumentowałbym, że Frequentist versus Bayesian to najbardziej wyraźny podział, chociaż nawet to jest nieco niejasne w skrajnych przypadkach i większość ludzi w praktyce wydaje się być mieszanką tych dwóch.

Solidne i parametryczne / nieparametryczne nie są tak naprawdę podziałami, ale różnymi narzędziami do różnych problemów. Wprawdzie są ludzie, którzy pracują tylko nad problemami, które dają się rozwiązać jednemu lub drugiemu, ale to są ludzie, a nie rzeczywiste statystyki - i twierdzę, że nawet większość ludzi. Aby posłużyć się przykładem, argumentowałbym, że nie ma „podziału w stolarstwie” między młotami a śrubokrętami, chociaż znam faceta, który nienawidzi używania gwoździ.

Powiedziałbym, że o wiele głębszy podział w statystyka jest tym, jak jest postrzegana z perspektywy matematyka w porównaniu z oddanym statystykiem w porównaniu ze statystycznym badaczem stosowanym.

Aby odpowiedzieć na drugie pytanie: czasami

Są chwile kiedy musisz użyć jednej metody - ponieważ ta metoda została zaprojektowana do działania, gdy inne zawodzą. Przychodzą mi na myśl dokładne statystyki. Ale jest wiele, wiele pytań, w których działa wiele podejść. Na przykład do projektu, nad którym pracuję, można podejść za pomocą metody Bayesowskiej lub Frequentystycznej i zastosować podejście parametryczne, półparametryczne lub nieparametryczne. To sześć możliwych kombinacji narzędzi i wiarygodne argumenty dla każdego. Ostatecznie wybrałem metodę, która będzie dla mnie najbardziej przydatna w tym projekcie .

Dzięki za odpowiedź. Czy znasz jakieś książki na temat wiedzy, jaką metodę zastosować, biorąc pod uwagę jakiś problem? Jestem studentem matematyki, który koncentruje się na teorii prawdopodobieństwa i czuję, że brakuje mi bardziej „praktycznych” umiejętności, takich jak wiedza, kiedy zastosować jakąś metodę, biorąc pod uwagę prawdziwy problem. Czy znałbyś jakąkolwiek literaturę na ten temat?


To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...