Pytanie:
Jakie praktyczne implikacje / interpretacje ma rozkład kurtotyczny?
russellpierce
2010-09-05 20:59:43 UTC
view on stackexchange narkive permalink

Wiem, co wskazuje drugi moment (wariancja), a także co wskazuje trzeci moment (skośność). Wiem, że na histogramie czwarty moment (kurtoza) wskazuje na „podglądanie” danych. Moje pytanie dotyczy praktycznych implikacji / interpretacji rozkładu kurtotycznego. Pytam o to, ponieważ nie znalazłem jeszcze przypadku, w którym uważałem, że czwarty moment byłby teoretycznie interesujący i możliwy do zinterpretowania. Rozumiem, że takie interpretacje / implikacje mogą być specyficzne dla zbioru danych, dlatego szukam opisów przykładowych zbiorów danych, w których kurtooza rozkładu była teoretycznie interesująca i możliwa do zinterpretowania.

Cztery odpowiedzi:
John Salvatier
2010-09-05 23:55:01 UTC
view on stackexchange narkive permalink

Kurtooza wskazuje również na „grubą ogonowość” rozkładu. Dystrybucja z wysoką kurtoozą będzie miała wiele wydarzeń ekstremalnych (zdarzenia z dala od centrum) i wiele wydarzeń „typowych” (zdarzenia blisko centrum). Dystrybucja z niską kurtoozą będzie miała zdarzenia w umiarkowanej odległości od centrum. To zdjęcie może pomóc: http://mvpprograms.com/help/images/KurtosisPict.jpg

Dobra odpowiedź, John. Zauważ, że kurtoza zwykle nie jest warta uwagi, gdy dystrybucja jest wypaczona: pochylenie już mówi, że będzie znaczna kurtoza. Tak więc dobre aplikacje dotyczą zbiorów danych, o których wiadomo a priori, że są (w przybliżeniu) symetryczne. Reszty często są w ten sposób: kurtooza może być szybkim sposobem numerycznym oceny kształtu ich rozkładu. Dodatkową kwestią jest to, że próbkowanie * wariancja * odchylenia standardowego jest funkcją kurtozy, więc jeśli szacujesz SD lub wariancje, możesz rzucić okiem na kurtozę, aby ocenić dokładność.
@whuber: w rzeczywistości zakres możliwych wartości skosu i _ nadmiernej kurtozy_ pozwala na dystrybucje z pewnym odchyleniem i zerową nadmierną kurtoozą.
shabbychef
2010-09-06 07:58:31 UTC
view on stackexchange narkive permalink

Wydaje mi się, że pamiętam, że mediana ma mniejszy błąd standardowy niż średnia, gdy próbki są pobierane z rozkładu leptokurtycznego, ale średnia ma mniejszy błąd standardowy, gdy rozkład jest platykurtyczny. Myślę, że przeczytałem to w jednej z książek Wilcoxa. W ten sposób kurtooza może dyktować, jakiego rodzaju testów lokalizacyjnych się używa ...

Nick Stauner
2013-11-27 15:55:50 UTC
view on stackexchange narkive permalink

Nie mam na myśli przykładu zbioru danych, na podstawie którego można by odpowiedzieć na pytanie dotyczące interpretacji, ale ta odpowiedź na powiązane pytanie wskazuje, że praktyczną konsekwencją kurtozy są błędne oszacowania wariancji.

Rozważając racjonalnie różnicę interpretacyjną, myślę, że istnieją istotne informacje w skrajnym przykładzie porównania między rozkładem normalnym a rozkładem całkowicie płaskim (np. wyniki rzutu kośćmi). To nie jest prawdziwy zbiór danych, ale jestem pewien, że każdy zna obie dystrybucje i może z łatwością utworzyć jeden z nich lub wymyślić inny przykład. Zasadniczo różnica między rozkładem platykurtycznym a rozkładem normalnym polega na tym, że centralna tendencja jest słabsza i jest mniejsza różnica między prawdopodobieństwem zdarzeń stosunkowo częstych i ekstremalnych / rzadkich. Mówiąc prosto, w przypadku dystrybucji leptokurtycznej jest odwrotnie: niektóre zdarzenia są bardzo częste, a większość pozostałych jest bardzo rzadkich, generalnie z powodu niezwykle silnej tendencji centralnej.

Warto również rozważyć ten cytat z Wikipedii (podkreślenie dodane):

Jedna wspólna miara kurtozy , pochodząca od Karla Pearsona, jest oparta na przeskalowana wersja czwartego momentu danych lub populacji, ale argumentowano, że to naprawdę mierzy ciężkie ogony, a nie szczyt ... Powszechną praktyką jest stosowanie skorygowanego wersja kurtozy Pearsona, kurtozy nadmiarowej, aby zapewnić porównanie kształtu danego rozkładu z rozkładem normalnym.

Powyższe rozróżnienie między kurtozą Pearsona i nadmiar kurtozy wydaje się mieć związek z komentarzem @whuber dotyczącym zaakceptowanej odpowiedzi.

msw
2010-09-06 03:41:40 UTC
view on stackexchange narkive permalink

Istnieje ryzyko kurtozy, które nie jest fantastycznie wyjaśnione pod tym linkiem.

Ogólnie rzecz biorąc, miary normalności (lub odchylenia od niej) są kluczowe, jeśli używasz analiz, które zakładają normalność. Na przykład standardowy współczynnik korelacji Pearsona- r dla standardowego konia pociągowego jest bardzo wrażliwy na wartości odstające i staje się zasadniczo nieważny, gdy nadmiar kurtozy odbiega od 0.

test jest często używany do sprawdzania rozkładu pod kątem normalności i uwzględnia kurtoozę próbki jako czynnik.

„Kluczowa” to kategoria; surowość jest wymiarem ciągłym, podobnie jak kurtoza (lub skrzywienie, jeśli o to chodzi). Rozważ [to powiązane pytanie] (http://stats.stackexchange.com/q/2492/32036). Zauważ również, że [skośność może być mniej problematyczna niż kurtoza w przypadku problemów z wariancją] (http://stats.stackexchange.com/a/30053/32036), takich jak korelacje. Wreszcie, w celu odróżnienia kurtozy od skosu, istnieje specjalny test kurtozy, który ignoruje skos: [test Anscombe-Glynn] (http://biomet.oxfordjournals.org/content/70/1/227.short ).


To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 2.0, w ramach której jest rozpowszechniana.
Loading...