Pytanie:
Czy ktoś może wyjaśnić znaczenie średniej stacjonarności w szeregach czasowych?
confused
2020-06-01 10:18:54 UTC
view on stackexchange narkive permalink

W regresji regularnej oczekiwana wartość Y |X może się zmienić.W rzeczywistości generalnie używamy regresji, gdy chcemy modelować tę zmianę w średniej warunkowej.

Nie rozumiem, dlaczego w szeregach czasowych chcemy, aby nasze serie były stacjonarne.Otrzymuję założenie wariancji stacjonarnej, ponieważ jest ono podobne do założenia o identycznym rozkładzie w regresji regularnej.Ale dlaczego podła stacjonarność jest tak ważna?

Wcześniej zamieściłem bardzo podstawową odpowiedź opartą na samym tytule, która nie uwzględniała szczegółów w Twoim poście o średniej stacjonarności.Po ponownym przeczytaniu twojego posta zaktualizowałem go o szczegóły bardziej szczegółowe dla twojego pytania, na które myślę, że teraz całkowicie odpowiada.
Weźmy na przykład poziomy cen i poziomy realnego PKB w czasie.Oba mają tendencję do wzrostu, więc nie są stacjonarne, więc istnieje między nimi dodatnia korelacja, czasami bardzo wysoka korelacja [jak w Wielkiej Brytanii w latach 1993-2007] (https://economics.stackexchange.com/questions/14259/can-cpi-and-real-gdp-have-high-korelacja / 14261).Błędem byłoby jednak sądzić, że implikuje to jakikolwiek związek między inflacją a wzrostem realnego PKB - związek między szeregami czasowymi poziomów jest w dużej mierze zależny od szeregów czasowych, które obie miary zmiany mają dodatnie średnie
Pięć odpowiedzi:
Skander H.
2020-06-01 11:46:04 UTC
view on stackexchange narkive permalink

W przypadku prognozowania szeregów czasowych należy przede wszystkim zrozumieć, że stacjonarność jest ważna głównie w kontekście ARiMR i modeli pokrewnych (AR: auto-regresywne, MA: średnia ruchoma). Istnieją inne typy modeli prognozowania szeregów czasowych, w których stacjonarność nie jest wymagana, na przykład Holt-Winters lub Facebook Prophet.

Oto dwa intuicyjne, jeśli nie całkowicie rygorystyczne matematycznie, wyjaśnienia, dlaczego średnia stacjonarność jest ważna w przypadku ARiMR:

  • Komponent AR modeli ARMA traktuje modelowanie szeregów czasowych jako nadzorowany problem uczenia się, $ Y_t = a_1Y_ {t-1} + ... a_nY_ {tn} + c + \ sigma (t) $ . Powszechną zasadą w uczeniu nadzorowanym jest to, że dystrybucja danych szkoleniowych i dystrybucja danych testowych powinny być takie same, w przeciwnym razie model będzie źle działał w testach poza próbą i na danych produkcyjnych. Ponieważ w przypadku danych szeregów czasowych, zestaw treningowy to przeszłość, a zestaw testowy to przyszłość, wymóg stacjonarności polega po prostu na zapewnieniu, że rozkład pozostanie niezmieniony w czasie. W ten sposób unikniesz problemów, które pojawiają się podczas uczenia modelu na danych, które mają inną dystrybucję niż dystrybucja testowa / produkcyjna. A w szczególności średnia stacjonarność oznacza po prostu, że średnia zestawu pociągowego i średnia testu powinny pozostać takie same.

  • Jeszcze prostsza uwaga: weź możliwie najbardziej podstawowy model ARMA, model $ AR (1) $ : $$ Y_t = aY_ {t-1} + c + \ sigma $$ , więc rekurencyjna relacja do szacowania na podstawie kroku na podstawie poprzedniego to: $$ \ hat {Y} _t = a \ hat {Y} _ {t-1} + c $$ , $$ \ hat {Y} _t - c = a \ hat {Y} _ {t-1} $$ przyjmując oczekiwaną wartość: $$ E (\ hat {Y} _t) - c = aE (\ hat { Y} _ {t-1}) $$ , co oznacza, że: $$ a = \ frac {E (\ hat {Y} _t) - c} {E ( \ hat {Y} _ {t-1})} $$ , więc jeśli chcemy, aby $ a $ pozostawał niezmieniony w czasie, czyli początek założenie modelu $ AR (1) $ , ponieważ chcemy, aby był podobny do regresji liniowej, a następnie $ E ( \ hat {Y} _t) $ musi pozostać taki sam dla wszystkich $ t $ , tzn. Twój serial ma być wrednym stacjonarnym.

Powyższe uwagi dotyczą również ogólnego przypadku ARMA, z $ AR (p) $ i $ MA (q) $ , chociaż matematyka jest nieco bardziej skomplikowana niż to, co opisuję, ale intuicyjnie idea jest wciąż ta sama. „I” w ARIMA oznacza „Zintegrowany”, który odnosi się do procesu różnicowania, który pozwala przekształcić bardziej ogólny szereg czasowy w taki, który jest stacjonarny i może być modelowany przy użyciu procesów ARMA.

Nie zgadzam się z charakterystyką @Alexis, która mówi, że „ że szeregi czasowe są nieruchome, w mniejszym lub większym stopniu ucieleśnia światopogląd, że przeszłość nie ma znaczenia ” - jeśli już, to jest na odwrót: przekształcanie czasuszereg na stacjonarny do celów modelowania polega na dokładnie sprawdzaniu, czy w szeregach czasowych istnieją jakieś struktury przyczynowe / deterministyczne poza tylko trendem i sezonowością.To znaczy.czy przeszłość wpływa na teraźniejszość lub przyszłość w sposób bardziej subtelny niż tylko zmiany na dużą skalę?(Ale mogę po prostu źle zinterpretować to, co ona próbuje powiedzieć).

Ona, nie on.Zastanawiam się, czy rozmawiamy obok siebie?Zgadzam się co do „poza trendami i poza sezonowością”.Chodzi mi o to, że jeśli, powiedzmy, utworzysz model, taki jak $ y_ {ti} = \ beta_0 + BX_ {ti} + f (t, T) + \ text {error} $ (tj. „Modele podłużne”),ignorują dynamiczną / nieliniową naturę przeszłości $ y $ wpływają na to w chwili $ t $.
@Alexis, moje najgłębsze przeprosiny.(Skander oznacza po arabsku „Aleksander”, więc mam tendencję do rzutowania się na każdego, kto ma podobny wzór imienia). I tak, wydaje się, że zgadzamy się co do faktów.doświadczenie, nawet prosty proces, który jest „prawdziwie” AR, a także stacjonarny, jest niezwykle rzadki. Istnieją różnego rodzaju niestacjonarne przykłady (np. dynamika populacji), ale są szanse, że proces będzie zarówno stacjonarny, jak i posiadający MZD,wygląda na to, że $ Y_t = a_1Y_ {t-1} + a_2Y_ {t-2} $? Więc ARIMA jest dość mocnym założeniem.
Bez obaw!Cóż, * podałem * dwa przykłady (konsumpcja dóbr uzależniających i rozpowszechnienie chorób zakaźnych), w których modele przyczynowe * muszą * obejmować przeszłość wpływającą na teraźniejszość.:)
„Modele przyczynowe muszą pociągać za sobą przeszłość wpływającą na teraźniejszość”, ale o to chodzi: mają doskonały sens, ale z tego samego powodu, dla którego mają sens, nie mogą być również stacjonarne (np. przykład choroby zakaźnej, który podałeś, pokazuje wykładniczywzrost, nawet nie liniowy lub wielomianowy, co jest najbardziej ARIMA z różnicowaniem).
Cóż ... potrzebowałbyś równoczesnych równań, a nie jednego równania, na przykład, aby stworzyć model przedziałowy (i który może modelować rodzaje wzrostu, o których wspominasz) ... (Ponadto: * nie * twierdzę, że ARIMAzajmowanie się stacjonarnością / niestacjonarnością jest wszystkim i kończy wszystko).Modelowanie (stacjonarne) * zmiana * jest ważniejsze niż modelowanie (niestacjonarne) poziomu dla wnioskowania przyczynowego.Stil: Podoba mi się twój punkt widzenia ... jest do żucia i będzie czymś, o czym myślę, więc dziękuję!
Dlaczego w twojej definicji modelu AR (1) zamiast $ \ varepsilon_t $ występuje $ \ sigma $?I z twojej definicji, jak otrzymujesz $ \ hat Y_t = a \ hat Y_ {t − 1} + c $?
@RichardHardy $ \ sigma $, $ \ sigma (t) $, $ \ sigma_t $, $ \ epsilon_t $, różne sposoby powiedzenia tego samego.
Oto jedno odniesienie (spośród wielu) do równania prognozy: https://people.duke.edu/~rnau/411arim.htm#arima100
Dziękuję Ci.$ \ sigma $ i $ \ sigma_t $ nie mogą być tym samym, ponieważ pierwsza jest stała w czasie, podczas gdy druga zmienia się w czasie.Co więcej, $ \ sigma $ jest standardowym zapisem odchylenia standardowego.W ustawieniu szeregu czasowego może być stała lub zmienna w czasie, powszechnie oznaczana odpowiednio przez $ \ sigma $ i $ \ sigma_t $.Aby uniknąć nieporozumień, użyłbym $ \ varepsilon_t $ (lub mniej popularnego, ale wciąż rozpowszechnionego $ u_t $ lub $ v_t $, a nawet rzadkiego $ a_t $, jak w podręcznikach Rueya S. Tsaya) do oznaczenia błędu ARModele MA i ARMA.
Poza tym, gdzie w cytowanym dokumencie znajdujesz $ Y $ z czapkami po * obu stronach * równania?
@RichardHardy, jeśli prognozujesz więcej niż jeden krok na raz, to Y po obu stronach równania to szacunki $ \ hat {Y} $, zobacz koncepcję prognozowania iteracyjnego lub rekurencyjnego.
Thomas Lumley
2020-06-01 11:26:27 UTC
view on stackexchange narkive permalink

Stacjonarność jest ważna, ponieważ jest matematycznie mocnym założeniem, które wciąż jest znacznie słabsze niż niezależność lub zależność o skończonym zasięgu.

W niektórych sytuacjach jest to ważne przede wszystkim ze względu na wykonalność matematyczną: łatwiej jest najpierw dowiedzieć się, co jest prawdą w przypadku stacjonarnych szeregów czasowych, a następnie możesz popracować nad złagodzeniem założeń. Być może potrzebujesz tylko stacjonarności o słabym wyczuciu lub stacjonarności średniej plus jakiś stan ogona lub cokolwiek innego. A może potrzebujesz stacjonarności, aby wynik był dokładny, ale zachowuje się mniej więcej przy słabszych założeniach.

W innych sytuacjach stacjonarność jest ważna, ponieważ istnieje tak wiele sposobów, aby być niestacjonarnym, że trudno byłoby sobie z nimi poradzić. Jeśli problem można przybliżyć serią stacjonarną, jest to duża praktyczna zaleta. W tym miejscu należy pamiętać, że seria stacjonarna $ X (t) $ , która pojawia się w matematyce, może nie być nieprzetworzonymi danymi. Na przykład tradycyjne modele ARMA są stacjonarne, ale zazwyczaj przed dopasowaniem do nich chciałbyś usunąć zależności sezonowe i trendy. Możesz chcieć przekształcić logarytm szereg, który ma rosnącą średnią i wariancję. I tak dalej.

Alexis
2020-06-01 10:36:56 UTC
view on stackexchange narkive permalink

Po pierwsze, twoje średnie szacunki i błędy standardowe będą mocno obciążone, jeśli używasz któregokolwiek z narzędzi wnioskowania, które zakładają i.i.d, co oznacza, że wyniki mogą być fałszywe.Może to być nawet prawdą, jeśli dane są słabo stacjonarne, ale okres nauki jest krótszy niż czas, w którym seria osiąga równowagę po zakłóceniu.

Po drugie, założenie, że szeregi czasowe są stacjonarne, w mniejszym lub większym stopniu ucieleśnia światopogląd, zgodnie z którym przeszłość nie ma znaczenia (np. dzisiejsze występowanie COVID-19 jest całkowicie niezależne od wczorajszego występowania COVID-19; \ $ per capita wydany w tym roku na uzależniające towary, takie jak papierosy, jest całkowicie niezależny od \ $ na mieszkańca wydanych na nie w zeszłym roku)… trochę nierealne.

Z całym szacunkiem nie zgadzam się z twoim drugim stwierdzeniem.Zobacz moją odpowiedź.
Gdyby przeszłość nie miała znaczenia, czy zbieranie danych z przeszłości w celu wnioskowania na temat aktualnych właściwości procesu będącego przedmiotem zainteresowania lub przewidywania przyszłej realizacji procesu miałoby sens?
@SkanderH.Myślę, że nie rozumiesz mojego drugiego stwierdzenia.
@RichardHardy Miałoby to znaczenie tylko w tym sensie, że wielkość twojej próby zwiększa się, gdy starasz się oszacować jakąś właściwość i.i.d.zmienna.Mój komentarz jest oparty na programach szkoleniowych * wielu * nauk o populacji na poziomie doktoranckim, które są mniej lub bardziej ślepe na pytania dotyczące stacjonarności i modelowania szeregów czasowych, wolą uczyć badaczy, aby po prostu wrzucali funkcję czasu do modelu i nazywali todzień.
@RichardHardy, „jeśli przeszłość nie miała znaczenia” oznacza tutaj, że rozwiązanie systemu dynamicznego nie jest zależne od ścieżki (może z wyjątkiem być może w jakiś trywialny sposób) i istnieją ustalone parametry (niezależne od ścieżki) do oszacowania za pomocą odpowiedniej techniki.
@PatrickT, dziękuję, to jest pomocne.
@PatrickT Dziękujemy za większą elokwentność.:)
Noah Tsaying
2020-06-02 08:35:41 UTC
view on stackexchange narkive permalink

Stacjonarny oznacza, że ​​statystyki opisujące proces losowy są stałe. „Bez pamięci proces Markowa” to inny sposób na określenie stacjonarnego, tak jak mówi się, że funkcja generująca prawdopodobieństwo nie ma terminów „sprzężenia zwrotnego”, ale jeśli rozpoznasz te słowa, możesz nie zadawać tego pytania. FWIW „słabo stacjonarny” to nie to samo, stałe lub poznawalne tempo zmian statystyk byłoby słabo stacjonarne, podobnie jak coś, co uśrednia, ale jest trochę bardziej zaangażowane, więc rozważ to uczciwe ostrzeżenie, że jest więcej informacji na wypadek, gdyby to część układanki, ale szczegółowe opisanie wszystkiego, co nie jest stacjonarne, zmieniłoby prostą odpowiedź w złożoną odpowiedź.

Dlaczego stacjonarny jest ważny? Powszechnie używane formuły statystyczne są tworzone w celu wykorzystania zestawu danych do wyodrębnienia nieprecyzyjnego opisu z możliwą do oszacowania dokładnością nieznanego inaczej procesu losowego. We wzorach założono, że dodanie większej liczby próbek zwiększa dokładność opisu poprzez zmniejszenie niepewności. W tym celu tendencja Mean Central, tj. Ergodyczna w średniej, musi być prawdziwa. Jeśli sam proces losowy się zmienia, np. wartość średnia lub wariancja się zmienia, to podstawowe założenie jest nieprawidłowe, nie można dokonać lepszego oszacowania.

Ogólnie mówiąc „co się dzieje”, jeśli średnia porusza się jako funkcja liniowa czasu, obliczona średnia będzie reprezentować średnią ważoną w czasie, a obliczona wariancja będzie zawyżona. Możliwe jest obliczenie „optymalnego a posteriori” (po fakcie) oszacowania procesu niestacjonarnego, a następnie wykorzystanie go do uzyskania znaczących statystyk, ponieważ najlepsze oszacowanie funkcji czasu minimalizuje wariancję. Łatwo też postawić hipotezę jakiejś funkcji czasu wyższego rzędu i stworzyć złożony model, który wydaje się być poprawny i przewidujący, który w rzeczywistości nie ma mocy predykcyjnej, ponieważ modelował migawkę losowości, a nie bazowy trend czasowy.

Ryan
2020-06-02 20:44:32 UTC
view on stackexchange narkive permalink

Krótko i słodko:

Parametry muszą być stałe. Jeśli szereg nie jest stacjonarny, to parametry, które szacujesz, same będą funkcjami czasu. Ale model zakłada, że ​​są to stałe, jako takie oszacujesz średnią wartość parametru w okresie czasu. Zobacz odpowiedź Skandera, dlaczego, nie będę zagłębiać się w matematykę, ponieważ on już to zrobił.

To stwarza co najmniej 2 problemy:

  1. Twoje szacunki dotyczące prawdziwej wartości parametru są prawdopodobnie błędne, ponieważ w dowolnym momencie wartość parametru może różnić się od jego średniej wartości. Dlatego wszelkie wnioski wyciągnięte na podstawie danych są prawdopodobnie błędne. Prowadzi to do fałszywych regresji / korelacji.
  2. Nie można używać modelu do przewidywania przyszłości. Ponieważ twój parametr jest teraz funkcją czasu i nie wiesz, jak ewoluuje w czasie, każda prognoza, którą tworzysz, jest kompletna (przepraszam za mój francuski) bzdura.

Osiągnięcie stacjonarności jest właściwie dość łatwe. Musimy tylko różnicować, dopóki nie będziemy mieli stacjonarnej serii. Więc po prostu zrób to.



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 4.0, w ramach której jest rozpowszechniana.
Loading...