Pytanie:
W jaki sposób rozkład prawdopodobieństwa może się różnić?
Delphine
2016-04-05 17:19:47 UTC
view on stackexchange narkive permalink

Jak, na przykład, rozkład Gamma może odbiegać blisko zera (dla odpowiedniego zestawu parametrów skali i kształtu powiedzmy kształt $ = 0,1 $ i skala $ = 10 $) i nadal mieć obszar równy jeden?

Jak rozumiem, obszar rozkładu gęstości prawdopodobieństwa powinien być zawsze równy jeden. Jeśli weźmiesz rozkład delta Diraca, który rozbiega się na zero, ale gdziekolwiek indziej wynosi zero, masz pole równe jeden.

W jakiś sposób, gdybyś wziął obszar rozbieżnego rozkładu Gamma, mógłbyś wyrazić to jako obszar rozkładu delta Diraca, plus coś więcej, ponieważ ma wagę niezerową na poziomie x \ neq0 $, więc byłoby większe niż jeden.

Czy ktoś może mi wyjaśnić, gdzie moje rozumowanie jest błędne ?

Istnieje wiele rozkładów _ (takich jak rozkład normalny) _, które są zdefiniowane na całej linii rzeczywistej, wszędzie mają> 0 $, ale mają skończoną powierzchnię.Weź (główną ćwiartkę) tego rozkładu i obróć go wokół linii $ x = y $.Teraz masz rozkład o tym samym obszarze, który rozbiega się przy $ x = 0 $.
Wyszukaj „Paradoks Zenona” - może Cię tu zainteresować
@Delphine Czas na teorię pomiaru!powodzenia!
Pięć odpowiedzi:
Stephan Kolassa
2016-04-05 17:50:56 UTC
view on stackexchange narkive permalink

Delta Diraca nie jest tutaj zbyt pomocna (chociaż jest interesująca), ponieważ rozkład Gamma ma ciągłą gęstość, podczas gdy Dirac jest mniej więcej tak nieciągły, jak to tylko możliwe.

Masz rację, że całka gęstości prawdopodobieństwa musi wynosić jeden (będę się trzymał tylko gęstości zdefiniowanych na osi dodatniej),

$$ \ int_0 ^ \ infty f ( x) \, dx = 1. $$

W przypadku Gamma gęstość $ f (x) $ rozbiega się jako $ x \ do 0 $, więc mamy coś, co nazywa się niewłaściwym całka . W takim przypadku całka jest definiowana jako granica, gdy granice całkowania zbliżają się do punktu, w którym całka nie jest zdefiniowana,

$$ \ int_0 ^ \ infty f (x) \, dx: = \ lim_ {a \ to 0} \ int_a ^ \ infty f (x) \, dx, $$

tak długo, jak ten limit istnieje .

(Nawiasem mówiąc, używamy tego samego nadużycia notacji, aby nadać znaczenie symbolowi "$ \ int ^ \ infty $", który jest zdefiniowany jako granica całki $ \ int ^ b $ jako $ b \ do \ infty $ , znowu tak długo, jak ten limit istnieje . Więc w tym konkretnym przypadku mamy dwa problematyczne punkty - 0 $, gdzie całka nie jest zdefiniowana, i $ \ infty $, gdzie nie możemy ocenić całkę bezpośrednio. W obu przypadkach musimy pracować z granicami).

W szczególności w przypadku rozkładu Gamma, pomijamy problem. Najpierw definiujemy funkcję Gamma w następujący sposób:

$$ \ Gamma (k): = \ int_0 ^ \ infty y ^ {k-1 } e ^ {- y} \, dy. $$

Następnie udowadniamy, że ta definicja ma sens, biorąc pod uwagę różne granice przedstawione powyżej. Dla uproszczenia możemy tutaj trzymać się $ k>0 $, chociaż definicję można również rozszerzyć na (wiele) wartości zespolonych $ k $. To sprawdzenie jest standardowym zastosowaniem rachunku różniczkowego i niezłym ćwiczeniem.

Następnie podstawiamy $ x: = \ theta y $ na $ \ theta>0 $ i otrzymujemy przez zmianę wzoru na zmienne

p> $$ \ Gamma (k) = \ int_0 ^ \ infty \ frac {x ^ {k-1} e ^ {- \ frac {x} {\ theta}}} {\ theta ^ k} \, dx, $$

skąd to mamy

$$ 1 = \ int_0 ^ \ infty \ frac {x ^ {k-1} e ^ {- \ frac {x} {\ theta}}} {\ Gamma (k) \ theta ^ k} \, dx . $$

To znaczy całka całkuje do jedynki, a zatem jest gęstością prawdopodobieństwa. Nazywamy to rozkładem Gamma z kształtem $ k $ i skalą $ \ theta $.

Teraz zdaję sobie sprawę, że naprawdę przeszedłem tę odpowiedzialność. Sedno argumentacji polega na tym, że powyższa definicja funkcji Gamma ma sens. Jest to jednak prosty rachunek, a nie statystyki, więc czuję się tylko bardzo nieznacznie winny, kierując cię do twojego ulubionego podręcznika do matematyki i znacznika funkcji gamma w Math.SO, zwłaszcza to pytanie i to pytanie.

Powinienem rzeczywiście wrócić do swoich książek, minęło trochę czasu!Dzięki za szczegółową odpowiedź!
David Z
2016-04-05 23:15:27 UTC
view on stackexchange narkive permalink

W jakiś sposób, gdybyś wziął obszar rozbieżnego rozkładu Gamma, mógłbyś go wyrazić jako obszar rozkładu delta Diraca, plus coś więcej, ponieważ ma niezerową wagę w $ x \ neq 0 $ więc byłaby większa niż jeden.

W tym miejscu twoje rozumowanie jest błędne: nie możesz automatycznie wyrazić żadnej funkcji, która jest nieskończona przy $ x = 0 $ jako rozkład delta plus coś więcej . W końcu, gdybyś mógł to zrobić za pomocą $ \ delta (x) $, kto powiedziałby, że nie mógłbyś tego zrobić również z $ 2 \ delta (x) $? Lub 10 $ ^ {- 10} \ delta (x) $? Albo jakikolwiek inny współczynnik? Równie słuszne jest stwierdzenie, że te rozkłady są zerowe dla $ x \ neq 0 $ i nieskończone przy $ x = 0 $; dlaczego nie zastosować do nich tego samego rozumowania?

Właściwie dystrybucje (w matematycznym sensie teorii dystrybucji) należy traktować bardziej jak funkcje funkcji - wstawiamy funkcję i wyjmij numer. W szczególności dla rozkładu delta, jeśli wstawisz funkcję $ f $, otrzymasz liczbę $ f (0) $. Dystrybucje nie są normalnymi funkcjami liczb do liczb. Są bardziej skomplikowane i wydajniejsze niż takie „zwykłe” funkcje.

Pomysł zamiany funkcji na liczbę jest dobrze znany każdemu, kto przywykł do czynienia z prawdopodobieństwem. Na przykład szereg momentów rozkładu - średnia, odchylenie standardowe, skośność, kurtooza itd. - można traktować jako reguły, które zmieniają funkcję (rozkład prawdopodobieństwa) w liczbę (odpowiedni moment). Weźmy na przykład średnią / oczekiwaną wartość. Ta reguła zamienia rozkład prawdopodobieństwa $ P (x) $ na liczbę $ E_P [x] $, obliczoną jako $$ E_P [x] = \ int P (x) \, x \ \ mathrm {d} x $$ Lub reguła wariancji zamienia $ P (x) $ na liczbę $ \ sigma_P ^ 2 $, gdzie $$ \ sigma_P ^ 2 [x] = \ int P (x) \, (x - E_P [x]) ^ 2 \ \ mathrm {d} x $$ Mój zapis jest tutaj trochę dziwny, ale mam nadzieję, że masz pomysł. 1

Możesz zauważyć coś, co te reguły mają ze sobą wspólnego: we wszystkich sposób przechodzenia z funkcji do liczby polega na całkowaniu funkcji pomnożonej przez inną funkcję ważącą. Jest to bardzo powszechny sposób przedstawiania rozkładów matematycznych. Więc naturalne jest zastanawianie się, czy istnieje jakaś funkcja ważąca $ \ delta (x) $, która pozwala na przedstawienie działania takiego rozkładu delta? \ \ mathrm {d} x $$ Możesz łatwo ustalić, że jeśli istnieje taka funkcja, to musi ona wynosić 0 $ na każde $ x \ neq 0 $. Ale nie możesz uzyskać wartości $ \ delta (0) $ w ten sposób. Możesz pokazać, że jest większa niż jakakolwiek liczba skończona, ale nie ma rzeczywistej wartości $ \ delta (0) $, która sprawiłaby, że to równanie działa, korzystając ze standardowych pomysłów integracji. >

Powodem tego jest to, że w rozkładzie delta jest coś więcej niż tylko to: $$ \ begin {cases} 0, & x \ neq 0 \\ \ infty, & x = 0 \ end {cases} $$ To „$ \ infty $” jest mylące. Oznacza cały dodatkowy zestaw informacji o rozkładzie delta, których normalne funkcje po prostu nie mogą przedstawić. I dlatego nie można sensownie powiedzieć, że rozkład gamma jest „większy” niż rozkład delta. Jasne, przy każdym $ x > 0 $, wartość rozkładu gamma jest większa niż wartość rozkładu delta, ale wszystkie przydatne informacje o rozkładzie delta są zamknięte w tym punkcie na $ x = 0 $ i to informacje są zbyt bogate i złożone, aby można było powiedzieć, że jedna dystrybucja to więcej niż druga.


Szczegóły techniczne

1 Właściwie możesz odwrócić rzeczy i myśleć o samym rozkładzie prawdopodobieństwa jako o rozkładzie matematycznym. W tym sensie rozkład prawdopodobieństwa jest regułą, która przyjmuje funkcję ważenia, taką jak $ x $ lub $ (x - E [x]) ^ 2 $, do liczby, $ E [x] $ lub $ \ sigma_x ^ 2 $ odpowiednio. Jeśli myślisz o tym w ten sposób, notacja standardowa ma nieco więcej sensu, ale myślę, że ogólny pomysł jest nieco mniej naturalny w przypadku postu o rozkładach matematycznych.

2 Konkretnie, przez „standardowe pomysły integracji” mam na myśli integrację Riemanna i integrację Lebesgue'a, z których obie mają tę własność, że dwie funkcje różnią się tylko w jednym punkcie musi mieć tę samą całkę (przy tych samych granicach). Gdyby istniała funkcja $ \ delta (x) $, różniłaby się ona od funkcji $ 0 $ tylko w jednym punkcie, a mianowicie $ x = 0 $, a zatem całki obu funkcji musiałyby być zawsze takie same. \ int_a ^ b \ delta (x) f (x) \ \ mathrm {d} x = \ int_a ^ b (0) f (x) \ \ mathrm {d} x = 0 $$ Więc nie ma liczby, którą możesz przypisać do $ \ delta (0) $, aby odtworzyć efekt rozkładu delta.

Glen_b
2016-04-06 05:38:35 UTC
view on stackexchange narkive permalink

Rozważmy standardową gęstość wykładniczą $ f (x) = \ exp (-x) \ ,, \: x>0 $ i rozważ wykres $ y = f (x) $ vs $ x $ (lewy panel na diagramie poniżej).

Prawdopodobnie nie wydaje się, że jest to niezgłębione, że istnieje dodatnia gęstość dla wszystkich $ x>0 $, a mimo to obszar ten wynosi 1 $.

Teraz wymieńmy $ x $ i $ y $ ... czyli niech $ x = \ exp (-y) $ lub $ y = - \ ln (x) $, na $ 0<x \ leq 1 $. Teraz jest to poprawna gęstość, która asymptotuje do osi $ y $ (więc jest nieograniczona jako $ x \ do 0 $), ale jej powierzchnia jest wyraźnie identyczna z wykładniczą (tj. Obszar pod krzywą musi nadal wynosić 1 - wszystko zrobiliśmy to odzwierciedlało kształt, a odbicie chroni obszar).

enter image description here

Oczywiście więc zagęszczenia mogą być nieograniczone, ale mają obszar 1.

Aksakal
2016-04-05 18:43:50 UTC
view on stackexchange narkive permalink

To jest raczej kwestia rachunku różniczkowego, a nie statystyki. Pytasz, jak funkcja, która osiąga nieskończoność przy pewnych wartościach swojego argumentu, może nadal mieć skończone pole pod krzywą?

To ważne pytanie. Na przykład, jeśli zamiast funkcji Gamma wziąłeś hiperbolę: $ y = 1 / x $, dla $ x = [0, \ infty) $, to obszar pod krzywą nie jest zbieżny, jest nieskończony.

enter image description here

Jest więc cudowne, że ważona suma bardzo dużych, a nawet nieskończonych liczb zbiegała się w pewien sposób do liczby skończonej . Suma jest ważona, ponieważ jeśli spojrzysz na definicję całki Riemanna, może to być następująca suma: $$ \ int_0 ^ \ infty 1 / x dx = \ lim_ {n \ rightarrow \ infty} \ sum_ {i = 0} ^ n \ frac {\ Delta x_i} {x_i} $$ Tak więc, w zależności od tego, które punkty $ x_i $ wybierzesz, wagi $ \ Delta x_i $ mogą być małe lub duże. Kiedy zbliżasz się do 0, $ 1 / x_i $ staje się większe, ale tak samo $ \ Delta x_i $ staje się mniejsze. W tej konkurencji wygrywa $ 1 / x_i $, a całka nie jest zbieżna.

W przypadku rozkładu Gamma dzieje się tak, że $ \ Delta x_i $ kurczy się szybciej niż rośnie Gamma PDF, a obszar kończy się skończoną . To rachunek prosty, aby zobaczyć, jak dokładnie zbiega się do 1.

Chris Rackauckas
2016-04-05 20:57:32 UTC
view on stackexchange narkive permalink

Spójrz na poniższy przykład. Zauważ, że dla dowolnego skończonego $ N $,

$$ \ int_0 ^ N \ frac {1} {x} dx = \ log (N) - \ log (0) $$

ale $ \ log (0) $ jest niezdefiniowane, więc całka w pewnym sensie wynosi $ \ infty $ (ma to swoje ograniczenie, ale zignoruj ​​je). Ale

$$ \ int_0 ^ N \ frac {1} {\ sqrt {x}} dx = \ sqrt {N} - \ sqrt {0} = \ sqrt {N} $$

Ogólnie rzecz biorąc, jest to oparte na założeniu, że

$$ \ int \ frac {1} {x ^ p} dx = x ^ {1-p} $$

więc jeśli $ 1-p>0 $, podstawowe twierdzenie rachunku różniczkowego mówi, że całka jest skończona. Pomysł jest taki, że rozchodzi się wystarczająco wolno (gdzie $ p $ jest prędkością), że obszar jest nadal ograniczony.

Jest to podobne do zbieżności szeregów. Przypomnij sobie, że według testu p mamy to

$$ \ sum_0 ^ \ infty \ frac {1} {x ^ p} $$

zbiega się wtedy i tylko wtedy, gdy $ p>1 $. W tym przypadku potrzebujemy odpowiednio szybko $ x ^ p \ rightarrow \ infty $, gdzie ponownie $ p $ to prędkość, a 1 $ to punkt zwrotny.

Dlaczego to może być faktyczne? Pomyśl o płatku śniegu Kocha. W tym przykładzie dodajesz obwód płatka śniegu w taki sposób, aby obszar ten powoli się rozrastał. Wynika to z faktu, że jeśli utworzysz trójkąt równoboczny o bokach o wymiarach $ \ frac {1} {3} $, obwód wynosi 1, a pole powierzchni $ \ frac {1} {12 \ sqrt {3}} \ sim 0,05 $. Ponieważ obszar jest o wiele mniejszy niż obwód (jest to pomnożenie dwóch małych liczb zamiast dodawania!), Możesz dodać trójkąty w taki sposób, aby obwód sięgał nieskończoności, podczas gdy obszar pozostał skończony. Aby to zrobić, musisz wybrać prędkość, z jaką trójkąty zbliżają się do zera, i jak już pewnie się domyślasz, istnieje prędkość, przy której zmienia się ze zbyt wolnego i zapewniającego nieskończony obszar na wystarczająco szybki, aby dać skończony obszar. / p>

Podsumowując, rachunek różniczkowy mówi nam, że nie wszystkie osobliwości (to, czym są te „punkty nieskończoności”, takie jak zero) są takie same. Istnieją ogromne różnice oparte na „lokalnej prędkości” osobliwości. $ \ Gamma $ ma po prostu osobliwość, która jest „wystarczająco wolna”, aby obszar był skończony. Jeśli chcesz dowiedzieć się więcej o tym, dlaczego osobliwości działają w ten sposób, możesz zagłębić się w dużo więcej szczegółów w analizie złożonej i jej badaniu osobliwości złożonych funkcji analitycznych (którymi jest $ \ Gamma $).

To dużo dobrych punktów, dzięki!zapamiętam to


To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...