Pytanie:
Dlaczego statystyka będzie istotna przy wystarczająco dużych próbach, jeśli efekt populacji będzie równy zeru?
Tim
2013-05-18 02:38:17 UTC
view on stackexchange narkive permalink

Z Wikipedii

Biorąc pod uwagę dostatecznie dużą wielkość próby, porównanie statystyczne zawsze wykaże znaczącą różnicę, chyba że wielkość efektu populacji wynosi dokładnie zero.

Na przykład współczynnik korelacji Pearsona wynoszący 0,1 jest silnie statystycznie istotny, jeśli wielkość próby wynosi 1000. Podanie tylko znaczącej wartości p z tej analizy może być mylące, jeśli korelacja wynosi 0,1 jest zbyt mała, aby wzbudzić zainteresowanie w konkretnej aplikacji.

Zastanawiałem się, dlaczego „biorąc pod uwagę dostatecznie dużą wielkość próby, porównanie statystyczne zawsze wykaże znaczącą różnicę, chyba że wielkość efektu populacji dokładnie zero ”?

Dzięki i pozdrawiam!

Redaktor zainteresowany klarownością usunąłby niejawny podwójny negatyw w pierwszym stwierdzeniu („różnica ... chyba, że”), przekształcając go bardziej pozytywnie, np. „Gdy efekt populacji jest różny od zera, można go wykryć za pomocą wystarczająco dużej próbki”. Reszta jest myląca, ponieważ chociaż pierwsze stwierdzenie odnosi się do efektu * populacji *, przykład odnosi się do efektu * obserwowanego w próbce. * Lepszy przykład sugerowałby, że współczynnik korelacji * populacji * wynoszący 0,1 będzie dodatnia korelacja w wystarczająco dużej próbie (ale może nie w małej).
zobacz także [tutaj] (http://stats.stackexchange.com/questions/2516/are-large-data-sets-inrespect-for-hypothesis-testing/)
Dwa odpowiedzi:
COOLSerdash
2013-05-18 02:42:42 UTC
view on stackexchange narkive permalink

Wraz ze wzrostem wielkości próby, moc statystyczna (patrz poniżej) do wykrywania nawet najmniejszego rozmiaru efektu również rośnie, a te małe rozmiary efektów okazują się następnie istotne statystycznie, nawet jeśli nie mają znaczenie w ogóle. To tylko eksperyment myślowy, który zilustruje to dokładniej: co by było, gdybyś mógł włączyć do badania wszystkie osoby, które są zainteresowane. Wszystkie statystyki obliczone na podstawie tej pełnej „próbki” odzwierciedlałyby prawdziwe wartości w populacji bez błędów. Więc jeśli rozmiary efektu populacji są równe dokładnie 0, to i tylko wtedy okazałyby się one równe dokładnie 0. W przeciwnym razie natrafiłbyś na drobne różnice lub korelacje lub jakikolwiek jest rozmiar twojego efektu.

Ten post może być również interesujący w tym kontekście.

Dodatek

Tę wspaniałą analogię mocy statystycznej znalazłem w Harvey Motulsky Intuitive Biostatistics: A Nonmathematical Guide to Statistical Thinking (analogię pierwotnie opracował John Hartung):

Załóżmy, że wyślij dziecko do piwnicy po narzędzie, powiedzmy młotek. Dziecko wraca i mówi: „Nie ma młota”. Jaki jest twój wniosek? Czy młotek jest w piwnicy, czy nie? Nie możemy być w 100% pewni, więc odpowiedź musi być prawdopodobieństwem. Pytanie, na które naprawdę chcesz odpowiedzieć, brzmi: „Jakie jest prawdopodobieństwo, że młotek jest w piwnicy?” Aby odpowiedzieć na to pytanie, potrzebowalibyśmy wcześniejszego prawdopodobieństwa, a zatem statystyk bayesowskich. Możemy jednak zadać inne pytanie: „Jeśli młotek naprawdę jest w piwnicy, jaka jest szansa, że ​​Twoje dziecko by to znalazło? ” Od razu widać, że odpowiedź zależy:

  • Jak długo Twoje dziecko patrzyło? Jest to analogiczne do wielkości próbki. Im dłużej dziecko patrzy, tym większe jest prawdopodobieństwo, że znajdzie młotek. I co ważne: nawet jeśli młotek jest naprawdę mały, jeśli dziecko spędzało godziny na szukaniu, prawdopodobnie znajdzie młotek, pomimo jego niewielkich rozmiarów. Odnosi się to również do badań: im większy rozmiar próbki, tym mniejsze rozmiary efektów („młotki”) można wykryć.
  • Jak duży jest młotek? Jest to analogiczne do wielkości efektu. Młot jest łatwiejszy (tj. Szybszy) do znalezienia niż mały młotek. Badanie ma większą moc, jeśli efekt jest duży.
  • Jak zabrudzona jest piwnica? Łatwiej jest znaleźć młotek w uporządkowanej piwnicy niż w brudnej. Jest to analogiczne do eksperymentalnego rozproszenia (odchylenia). Badanie ma większą moc, gdy dane wykazują niewielkie odchylenia.

Twoje dziecko ma trudności, jeśli musi znaleźć mały młotek w krótkim czasie w brudnej piwnicy. Z drugiej strony, Twoje dziecko ma duże szanse na znalezienie, jeśli spędza dużo czasu na szukaniu młota w uporządkowanej piwnicy (więc posprzątaj piwnicę, zanim wyślesz dziecko na poszukiwanie!).

Rozsądnie jest być ostrożnym przy wydawaniu skrajnych lub uniwersalnych stwierdzeń, np. Coś jest „zawsze fałszywe”, ponieważ takie stwierdzenia są zazwyczaj (zawsze? :-) niepoprawne. W tym przypadku wydaje się pośrednio zakładać, że $ H_0 $ jest proste. Złożone hipotezy zerowe często są prawdziwe i mają liczne, przekonujące dowody na poparcie. Ale jak rozmowa zmieniła się w to, czy wartość null jest prawdą, gdy pytanie dotyczy tego, czy jest * fałszywe *?
@whuber, oczywiście, masz rację. Nie myślałem o złożonej hipotezie zerowej. Odpowiednio zmodyfikuję swoją odpowiedź (skasuję pierwszą część).
Tak, to jest problem z uniwersalnymi stwierdzeniami: zawsze znajdzie się jakiś łobuz, który przyjdzie z kontrprzykładem tylko po to, by zepsuć ci zabawę :-).
@whuber, haha, tak mi się wydaje :) Z drugiej strony: nie wymyśliłem uniwersalnego stwierdzenia. Nawet niektórzy [matematycy] (http://www.dur.ac.uk/r.j.coe/resmeths/critsig.htm) mają to na swojej stronie internetowej. Nawet niektóre [księgi statystyczne] (http://books.google.ch/books?id=VtU3-y7LaLYC&pg=PA53&lpg=PA53&dq=null+hypothesis+is+always+false&source=bl&ots=cyur4yimby&sig=iHN2n_8PWbepEQm=JsaXeXe&hl=JXaXeX8 = 0CDoQ6AEwAg).
Glen_b
2013-05-18 04:28:21 UTC
view on stackexchange narkive permalink

Aby uzyskać konkretność, wyobraź sobie test średnich na jednej próbie (duża próba, na czymś, gdzie istnieje średnia i wariancja populacji, aby nieco uprościć argument).

Niech różnica między prawdziwą średnią a hipotetyczną średnią z próby będzie dowolną różną od zera $ \ delta $. Wtedy rozkład próbkowania średniej próby pomniejszonej o hipotetyczną średnią będzie sam w sobie miał średnią $ \ delta $ i wariancję, która zmniejszy się proporcjonalnie do 1 $ / n $.

Jako taki, gdy $ n $ stanie się wystarczająco duży, prawdopodobieństwo, że statystyka testowa będzie poza obszarem odrzucenia, spada.

W rzeczywistości może pomóc myślenie o niej w kategoriach testu opartego na przedziale ufności. Przedział ufności dla średniej populacji zmniejszy się o $ \ frac {1} {\ sqrt n} $. Gdy $ n $ staje się wystarczająco duże, typowy CI zbliża się coraz bardziej do średniej populacji (oczywiście nadal jest to zmienna losowa), ale $ \ delta $ pozostaje stałe.

Ostatecznie połowa szerokości przedziału ufności („margines błędu”) jest zwykle znacznie mniejsza niż $ \ delta $ - co sprawia, że ​​hipoteza oznacza „daleko” - coraz więcej połówek szerokości typowy CI - na podstawie rzeczywistej średniej populacji (co daje prawdopodobieństwo odrzucenia zbliżone do 1)

Możesz skonstruować podobne argumenty dla prawie każdego testu hipotez dla punktu zerowego, o ile spełnionych jest kilka podstawowych warunków (jeśli nie masz spójności, argument się nie powiedzie).



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...