Podważanie błędnej instrukcji CLT

Dave

2020-06-22 21:14:34 UTC

view on stackexchange narkive permalink

Centralne twierdzenie graniczne (CLT) podaje kilka fajnych właściwości dotyczących zbieżności do rozkładu normalnego. Przed formalnym przestudiowaniem statystyk miałem bardzo mylne wrażenie, że CLT powiedział, że dane zbliżają się do normalności.

Teraz kłócę się o to ze współpracownikami. Twierdzę, że 68 $ \% $ danych nie musi mieścić się w jednym odchyleniu standardowym średniej, gdy mamy rozkłady inne niż normalne. Zgadzają się, ale potem mówią, że według CLT, ponieważ mamy wiele obserwacji (prawdopodobnie 50 000), nasze dane są bardzo zbliżone do normalnych, więc możemy użyć reguły empirycznej i powiedzieć, że 68 USD \% $ danych mieści się w granicach jednego odchylenia standardowego średniej. To oczywiście nieprawda. Ludność nie dba o to, ile obserwacji jest z niego wyciąganych; populacja to populacja, niezależnie od tego, czy z niej próbujemy, czy nie!

Jaki byłby dobry sposób na wyjaśnienie, dlaczego centralne twierdzenie graniczne nie dotyczy zbieżności rozkładu empirycznego?

Cóż, rozkład próbkowania (rozkład $ X_1, X_2, \ cdots, X_n $ lub $ \ bar {X} $, średnia próbki w tym przypadku) również nie jest zbieżny z rozkładem normalnym.Musisz więc być bardziej precyzyjny, jeśli chodzi o to, nad czym chcesz się urągać.

Edytowano @DilipSarwate.Z satysfakcją mogę powiedzieć współpracownikom, że CLT mówi, że coś zbliżonego do próbki oznacza zbieżność do normalności (wiem, że to nieprawda, ale prawdopodobnie jest wystarczająco blisko, aby przeprowadzić nieformalną dyskusję ... Nie muszę też wyjaśniać, dlaczego zbieżność w dystrybucji oznacza również), ale staram się wyjaśnić, dlaczego populacja nie zbliża się do normalności.

skup się na tym, co jest dokładnie zbieżne do normalnego zgodnie z CLT.w ten sposób łatwo wskazujesz, co * nie * jest zbieżne

Poproś współpracowników, aby sprawdzili swoje wnioski, gdy dane są binarne, takie jak wskaźnik rzutu uczciwej monety.

Myślę, że nie ma dobrego sposobu, aby wyjaśnić to ludziom, którzy nie są w stanie podążać za logicznym rozumowaniem.Więc może po prostu naucz się żyć ze swoimi współpracownikami

Rozkład próby rozbiega się w kierunku rozkładu populacji, gdy liczby rosną (i można to wykazać za pomocą kilku symulacji / testów / przykładów).Wydaje się, że dyskusja między tobą a twoimi współpracownikami dotyczy raczej pomieszania definicji / terminów.Co oznacza „nasze dane są bardzo zbliżone do normalnych”?Może warto wyjaśnić, w jakiej podstawowej dyskusji zostało to wykorzystane?Jaki jest problem, do którego koledzy stosują przybliżenie z rozkładem normalnym?Jakie masz dane, dlaczego nie pozwalają one łatwo wykazać, że $ 68 \% \ neq 1sd $?Co jest porównywane?

Więc to, co próbuję powiedzieć, to to, że może twoi koledzy nie mają racji w swoich słowach (a może nie poprawnie ich parafrazujesz), ale nie powinniśmy mocno doceniać tych słów (nie możemy winić myśli za nimikiedy nie są wyrażane zbyt rygorystycznie) i zamiast tego powinniśmy spróbować zrozumieć ukryte myśli.W związku z tym dlaczego nie miałbyś wyjaśnić podstawowej kwestii i udostępnić problem, do którego ma mieć zastosowanie ta CLT?Jest to o wiele bardziej jasne niż jednostronny pogląd na dyskusję między tobą a twoimi współpracownikami.https://en.wikipedia.org/wiki/XY_problem

@Dave, czy mógłbyś opisać podstawowy problem.Piszesz wyraźnie, że twoi koledzy się z tym zgadzają.Dlatego nie jest jasne, do czego się odnoszą, gdy używasz słowa dane dwukrotnie.* „Mówię, że 68% danych nie musi mieścić się w jednym odchyleniu standardowym średniej” * w porównaniu z * ”Zgadzają się, ale potem mówią… że 68% danych mieści się w zakresie jednego odchylenia standardowego średniej” *.Wydaje mi się, że mogą oznaczać coś innego (uważam, że ich odniesienie do „danych” jest „średnią z danych”), ale nie jest jasne, czy mogę to powiedzieć, nie znając podstawowego problemu.

Czy to odpowiada na twoje pytanie?[Jakie jest intuicyjne wyjaśnienie centralnego twierdzenia granicznego?] (Https://stats.stackexchange.com/questions/3734/what-intuitive-explanation-is-there-for-the-central-limit-theorem)