Jak pobrać próbkę z dyskretnej dystrybucji?

Barry

2013-08-21 01:40:40 UTC

view on stackexchange narkive permalink

Załóżmy, że mam rozkład rządzący możliwym wynikiem pojedynczej zmiennej losowej X. To jest coś w rodzaju [0,1, 0,4, 0,2, 0,3], gdzie X jest wartością 1, 2, 3, 4.

Czy możliwe jest próbkowanie z tego rozkładu, tj. generowanie liczb pseudolosowych dla każdego z możliwych wyników, biorąc pod uwagę prawdopodobieństwo tego wyniku. Więc jeśli chciałbym wiedzieć, jakie jest prawdopodobieństwo uzyskania 2, operacja próbkowania może zwrócić 0,34 lub coś podobnego.

Pytam o to, że próbuję zaimplementować politykę wyboru akcji dla metoda uczenia się ze wzmocnieniem oparta na pracy naukowej. Z tego, co zebrałem w artykule, autor jest w stanie próbkować rozkład przez „odwzorowanie rozkładu jednorodnego U [0,1] poprzez skumulowane funkcje gęstości prawdopodobieństwa otrzymane przez adaptacyjną całkowanie numeryczne”. Na tej podstawie sprawdza prawdopodobieństwa przejścia dla każdej próby ...

Byłbym wdzięczny za wszelkie informacje na ten temat ...

Z góry dziękuję

Istnieje wiele metod próbkowania dyskretnych rozkładów prawdopodobieństwa. Papier używa cdf (generuje uniform, $ U = u $ on (0,1), jeśli $ u <0,1 $ wyjście "1", jeśli to $ <0,1 + 0,4 $ wyjście "2" i tak dalej). Istnieją znacznie bardziej wydajne metody, jeśli problemem jest szybkość (np. Jeśli chcesz próbkować miliardy razy).

@Glen_b, czy mógłbyś wymienić bardziej wydajne metody próbkowania dyskretnego rv? To jest bardzo ciekawe.

@Riga zobacz moją odpowiedź poniżej

Tutaj jest fajny artykuł wyjaśniający „metodę aliasów”: http://www.keithschwarz.com/darts- designers-coins/

/ * Próbkowanie nierównego prawdopodobieństwa ; przypadek z wymianą * n to długości p i dop. p zawiera prawdopodobieństwa, perm * zawiera rzeczywiste wyniki, a ans zawiera tablicę wartości *, które były próbkowane. * / static void ProbSampleReplace (int n, double * p, int * perm, int nans, int * ans) {double rU; int i, j; int nm1 = n - 1; / * tożsamości elementów rekordu * / for (i = 0; i < n; i ++) perm [i] = i + 1; / * sortuj prawdopodobieństwa w porządku malejącym * / revsort (p, perm, n); / * oblicz skumulowane prawdopodobieństwa * / for (i = 1; i < n; i ++) p [i] + = p [i - 1]; / * oblicz próbkę * / for (i = 0; i < nans; i ++) {rU = unif_rand (); for (j = 0; j < nm1; j ++) {if (rU < = p [j]) przerwa; } ans [i] = perm [j]; }}