Pytanie:
Pomiar korelacji procesów punktowych
Anush
2013-09-13 01:46:29 UTC
view on stackexchange narkive permalink

Istnieje ogromna literatura dotycząca analizy szeregów czasowych. Wydaje się, że moje dane nie pasują do standardowego modelu, ponieważ składają się z czasów zdarzenia, czyli czasu, w którym zdarzenie ma miejsce. Jaki jest dobry sposób pomiaru korelacji między dwiema sekwencjami czasów zdarzeń? Czy jest jakaś literatura na temat analizy sekwencji czasowych zdarzeń?

Danymi mogą być, na przykład, czasy, w których określony neuron odpala. Więc w tym przypadku chciałbym powiedzieć, że czasy odpalania dwóch różnych neuronów są silnie skorelowane (lub nie).

Wydaje mi się, że to pytanie jest powiązane Analiza korelacji krzyżowej między procesami punktowymi.

Co dokładnie masz na myśli, mówiąc o swoich danych, to czasy zdarzeń? Czy jest to sytuacja dotycząca [analizy przeżycia] (http://en.wikipedia.org/wiki/Survival_analysis)? Czy to powtarzające się wydarzenia? Czy możesz powiedzieć więcej o swojej sytuacji, swoich danych (skąd pochodzą, co oznaczają) i swoich celach?
@gung Dodano przykład tego, co mnie interesuje.
Wyszukaj procesy stochastyczne _point_, jak są nazywane. Zaprojektowany do takich celów. Już szeroko stosowany w neurobiologii. Raczej zaawansowany matematycznie.
@AlecosPapadopoulos Dziękuję. Czy znasz jakąś metodę pomiaru korelacji? Czasami uzasadnienie matematyczne ukrywa metody, które w rzeczywistości są proste ... Mam nadzieję.
Każda metoda statystyki przestrzennej wykorzystywana do analizy procesów punktowych specjalizuje się (zwykle bardzo łatwo) w tej jednowymiarowej sytuacji. Zobacz na przykład http://www-personal.umich.edu/~jiankang/papers/paper/Statistical%20Inference%20and%20Simulation%20for%20Spatial%20Point%20Processes.pdf. Chociaż nie są to jedyne możliwe metody - jeden wymiar zazwyczaj ma wewnętrzną kolejność niedostępną w wyższych wymiarach i można ją wykorzystać - powinny one przynajmniej zapewnić dobry zestaw narzędzi na początek.
Cztery odpowiedzi:
Steve M
2015-09-29 03:50:28 UTC
view on stackexchange narkive permalink

Seria czasów zdarzeń to rodzaj procesu punktowego. Dobre wprowadzenie do pomiaru korelacji między procesami punktowymi, stosowanymi w neuronowych ciągach kolców, podaje Brillinger [1976]. Jedną z wczesnych, przełomowych prac dotyczących procesów punktowych jest praca Coxa [1955].

Najprostszą miarą powiązania między dwoma czasowymi procesami punktowymi (nazwijmy je $ A $ i $ B $) jest prawdopodobnie numer stowarzyszenia, $ n $. Aby obliczyć $ n $, za każdym razem w szeregu $ A $ definiuje się okno o szerokości połówkowej $ h $. Indywidualny numer asocjacji, $ c $, jest wtedy liczbą zdarzeń w serii $ B $, które mieszczą się w danym oknie, a $ n $ jest następnie definiowane jako $$ n (h) = \ Sigma_ {i = 1} ^ {N} c_i $$ Jest to generalnie obliczane dla zakresu opóźnień, $ u $, tak że otrzymujemy $ n (u, h = const) $ [patrz np. Równania 9 i 10 oraz rysunek 3 z Brillinger [1976]].

Jeśli szeregi $ A $ i $ B $ są nieskorelowane, to liczba asocjacji będzie się zmieniać w funkcji opóźnienia ze względu na odchylenia próbkowania, ale będzie miała stabilną średnią. Jeśli znormalizujemy przez $ 2hT $, gdzie $ T $ jest długością przedziału, z którego zostały pobrane nasze próbki, otrzymamy oszacowanie gęstości krzyżowej . Korelacje w różnych opóźnieniach czasowych można następnie zobaczyć, sprawdzając gęstość produktu krzyżowego pod kątem odchyleń od 1 (jeśli procesy są niezależne, gęstość produktów krzyżowych powinna wynosić 1, co jest oczekiwane przy dużych opóźnieniach dla większości procesów fizycznych).

Do oceny znaczenia tych odejść można podejść na wiele różnych sposobów, ale wielu zakłada, że ​​przynajmniej jednym z procesów jest Poissona [Brillinger, 1976; Mulargia, 1992]. Jeśli te założenia zostaną spełnione, 95-procentowe przedziały ufności dla gęstości różnych produktów można oszacować według [Brillinger, 1976] $$ 1 \ pm \ frac {1.96} {2 \ sqrt {} 2hTp_Ap_B} $$ gdzie $ p_A $ i $ p_B $ to średnie intensywności serii $ A $ i $ B $, podane przez $ p_A = N / T $, gdzie $ N $ to liczba zdarzeń w $ A $ (podobnie jak $ B $). Wycieczki poza C.I. wskazują zatem na znaczący związek między sekwencjami zdarzeń przy pewnych opóźnieniach.

Jeśli żaden z szeregów nie jest Poissona, wówczas do oszacowania przedziałów ufności można zastosować metodę ładowania początkowego [Morley i Freeman, 2007]. Przyjmując to podejście, ważne jest, aby zrozumieć system, jako że ponowne próbkowanie serii $ A $ i $ B $ może nie działać bez zastosowania, powiedzmy, bootstrapu ruchomego bloku, aby zachować korelacje w pociągach z kolcami. Podejście przyjęte przez Morleya i Freemana polegało na ponownym próbkowaniu z indywidualnych numerów asocjacji.

... widzimy, że n (u, h) jest sumą N indywidualnych skojarzeń c $ _i $ za podane u, h. Korzystając z tego zestawu indywidualnych asocjacji, możemy skonstruować nową serię, c * $ _ i $, rysując z zastąpieniem losowy wybór N indywidualnych skojarzeń. Podsumowanie tych N losowo wybranych asocjacji daje oszacowanie typu bootstrap liczby asocjacji dla danego u, h. Powtarzając to dla każdego lagu u, konstruujemy oszacowanie typu bootstrap numeru asocjacji z lag n * (u, h). Wykonanie tej procedury ładowania początkowego K razy pozwala nam modelować zmienność próbkowania w n (u, h).

Dalszą analizę dotyczącą oceny przedziałów ufności przy użyciu technik ładowania początkowego podali Niehof i Morley [2012 ], ale powyższe powinno działać dla dwóch serii neuronalnych kolców (lub podobnego prostego systemu).

Źródła:

  • Brillinger, DR (1976), Measuring the Association procesów punktowych: historia przypadku, Am. Math. Mon., 83 (1), 16–22.
  • Cox, D. R. (1955), Niektóre metody statystyczne związane z seriami zdarzeń, J. R. Stat. Soc., Ser. B, 17 (2), 129–164.
  • Mulargia, F. (1992), Związek czasu między seriami wydarzeń geofizycznych, Phys. Planeta Ziemia. Inter., 72, 147–153.
  • Morley, S. K. i M. P. Freeman (2007), O związku między północnymi zwrotami międzyplanetarnego pola magnetycznego a początkami podform, Geophys. Res. Lett., 34, L08104, doi: 10.1029 / 2006GL028891.
  • Niehof, J.T. i S.K. Morley (2012). „Określanie znaczenia powiązań między dwiema seriami zdarzeń dyskretnych: metody bootstrap”. Stany Zjednoczone. doi: 10.2172 / 1035497
Memming
2013-09-17 20:18:40 UTC
view on stackexchange narkive permalink

Niektórzy ludzie używają korelacji szeregowej przedziałów, aby to określić. Zasadniczo bierzesz współczynnik korelacji dwóch interwałów między szczytami, które są oddalone od siebie o $ m $.

Zobacz:

  • Maurice J. Chacron, Benjamin Lindner, André Longtin. Kształtowanie szumu przez korelacje interwałowe zwiększa transfer informacji. Physical Review Letters, tom. 92, nr 8. (25 lutego 2004), 080601, doi: 10.1103 / physrevlett.92.080601
user2304916
2017-08-03 02:38:28 UTC
view on stackexchange narkive permalink

Istnieją algorytmy do obliczania korelacji krzyżowej dwóch procesów punktowych (czasów zdarzeń) bezpośrednio, bez żadnego binowania danych wejściowych.Klasycznym z nich jest algorytm wielotau, który jest używany w spektroskopii korelacji fluorescencji (FCS) do skorelowania czasów przybycia fotonów w eksperymentach z opóźnieniami czasowymi, które są w przybliżeniu logarytmiczne.

Inny algorytm, również używany w FCS, umożliwia obliczenie korelacji krzyżowej w dowolnych odstępach czasu.Istnieje pakiet Pythona o nazwie pycorrelate, który implementuje ten drugi algorytm (konkretną funkcją, której należy szukać, jest pcorrelate ).Ten typ korelacji krzyżowej jest całkowicie ogólny i może być stosowany do autokorelacji lub korelacji krzyżowej dowolnych procesów punktowych.

AdamO
2013-09-13 02:44:17 UTC
view on stackexchange narkive permalink

Jeśli mierzyłeś oba neurony w sposób ciągły za pomocą jakiejś formy EEG, chciałbyś oszacować model ARIMA dla potencjału błonowego w kontrolowanym neuronie (jako regresor) w stosunku do neuronu, który przypuszczalnie unerwia (jako wynik) . Jeśli na ich potencjały błonowe niezależnie wpływają inne bodźce w mózgu, średnio nie będą wykazywać żadnego związku. Możesz również rozważyć dostosowanie się do opóźnionych skutków potencjału błonowego niezależnego neuronu.

Dziękuję Ci. statsmodel w Pythonie wydaje się mieć kod dla tego http://statsmodels.sourceforge.net/stable/generated/statsmodels.tsa.arima_model.ARIMA.html?highlight=arima. Czy to to samo?
Nie mam pojęcia. Używałem R tylko do takich analiz. Czy możesz połączyć kod źródłowy dla „statsmodels.tsa.arima_model.ARIMA”? Powinien to być po prostu model mieszany z autoregresyjną strukturą korelacji i efektami opóźnionej odpowiedzi.
Źródło znajduje się pod adresem http://statsmodels.sourceforge.net/devel/_modules/statsmodels/tsa/arima_model.html#ARIMA. Jednak myśląc o tym, uważam, że ARIMA nie jest odpowiednia dla procesów punktowych. Jeśli tworzysz funkcję z czasów, na przykład nie jest ona ciągła.
W jakim sensie jest mniej ciągły niż model regresji liniowej?
Chodzi mi o to, że wystąpienie zdarzenia jest binarne. Albo się zdarza, albo nie. Myślę, że w literaturze nazywa się to procesem punktu przestrzennego. Wydaje się, że typowym zastosowaniem ARIMA jest dokonywanie corocznych pomiarów czegoś. To całkiem inne ustawienie.


To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...