Wszyscy dużo słyszeliśmy o „spłaszczaniu krzywej”.Zastanawiałem się, czy te krzywe - które wyglądają jak dzwonki - można zakwalifikować jako Gaussa, mimo że istnieje wymiar czasowy.
Wszyscy dużo słyszeliśmy o „spłaszczaniu krzywej”.Zastanawiałem się, czy te krzywe - które wyglądają jak dzwonki - można zakwalifikować jako Gaussa, mimo że istnieje wymiar czasowy.
No.
Na przykład:
Nie w sensie rozkładu Gaussa prawdopodobieństwa : krzywa dzwonowa rozkładu normalnego (Gaussa) to histogram (mapa gęstości prawdopodobieństwa względem wartości pojedynczej zmiennej), ale zacytowane krzywe są (jak zauważyłeś) mapą wartości jednej zmiennej (nowe przypadki) względem drugiej zmiennej (czasu). (@Accumulation i @TobyBartels wskazują, że krzywe Gaussa są konstrukcjami matematycznymi, które mogą być niezwiązane z rozkładami prawdopodobieństwa; biorąc pod uwagę, że zadajesz to pytanie na temat statystyki SE, założyłem, że odniesienie się do rozkładu Gaussa było ważną częścią odpowiedzi na pytanie.)
Możliwe wartości w normalnej dystrybucji rozciągają się od $ - \ infty $ do $ \ infty $ , ale krzywa epidemii nie może mieć ujemnych wartości na osi y i przemieszczać się wystarczająco daleko w lewo lub w prawo na x , całkowicie skończą się przypadki, albo dlatego, że choroba nie istnieje, albo dlatego, że Homo sapiens nie istnieje.
Rozkłady normalne są ciągłe, ale krzywe epidemii zjawisk są w rzeczywistości dyskretne , a nie ciągłe: reprezentują nowe przypadki w każdej dyskretnej jednostce czasu. Chociaż możemy podzielić czas na mniejsze znaczące jednostki ( do pewnego stopnia), w końcu natrafiamy na fakt, że osoby z nowymi infekcjami są danymi zliczania (dyskretnymi).
Rozkłady normalne są symetryczne co do ich średniej, ale pomimo tego, że rysunek przekazuje użyteczną wiadomość dla zdrowia publicznego o potrzebie spłaszczenia krzywej, rzeczywiste krzywe epidemii są często pochylone w prawo i mają długie, cienkie ogony, jak pokazano poniżej.
Normalne rozkłady są jednomodalne, ale rzeczywiste krzywe epidemii mogą mieć jeden lub więcej wypukłości (tj. mogą być multimodalne, mogą nawet, jak w odpowiedzi @SextusEmpiricus, być endemiczne , gdziewracają cyklicznie).
Na koniec, oto krzywa epidemii COVID-19 w Chinach, widać, że krzywa generalnie odbiega od krzywej Gaussa (oczywiście istnieją problemy z wiarygodnością danych, biorąc pod uwagę, że wiele przypadkównie liczone):
Krzywe epidemiologiczne infekcji dróg oddechowych są krzywymi bardzo nieregularnymi. Zobacz na przykład wybuch epidemii SARS w latach 2002/2003
https://www.who.int/csr/sars/epicurve/epiindex/en/index1.html
aw przypadku chorób endemicznych mogą mieć charakter sezonowy. Zobacz na przykład logo euromomo
Oprócz spłaszczenia krzywej na ogół, która nie jest krzywą Gaussa, sytuacja będzie również bardziej zróżnicowana. Obraz, który krąży w Internecie, jest bardzo skrajnym przypadkiem, w którym krzywa wystaje znacznie powyżej progu i jest zmniejszana o połowę w wyniku pomiarów. Naszkicował idealną sytuację do argumentowania za drastycznymi środkami. Niekoniecznie musi tak być w przypadku COVID-19.
Bardziej złożone reprezentacje pokazują różne progi i mają bardziej subtelne różnice w krzywych. Jak tutaj
Nie jestem epidemiologiem i to pytanie należy zadać epidemiologom.
Po pierwsze, rysowanie krzywych Gaussa jest proste, ponieważ nawet podstawowe oprogramowanie do rysowania ma je zaimplementowane (np. Microsoft Excel), więc kiedy ludzie muszą narysować „rozkład”, często rysują Gaussa. Liczby „spłaszcz krzywą” mają na celu ukazanie ogólnej idei zjawiska, a nie dokładnego rozkładu tego zjawiska i które mogło się wydarzyć (nikt nie wie z góry, ponieważ jest zbyt wiele niewiadomych i zbyt wiele ruchomych części). Nawet skale figur nie są realistyczne; niektórzy eksperci wskazują, że różnica może być znacznie większa niż na takich liczbach.
Jeśli chodzi o kształt epidemii Gaussa, o ile wiem, jest to znane jako prawo Farra. Najpierw liczba zarażonych osób rośnie, a następnie spada, więc jest to podobne do krzywej Gaussa, ale dalekie jest od dokładnego dopasowania. Możesz znaleźć dyskusję w tym wątku na Twitterze, która podaje jako przykład badania, w którym zastosowano prawo Farra do przewidywania przypadków HIV / AIDS w USA, jak widać z fabuły, nie ma to nic wspólnego z rzeczywistym wynikiem.
Niektóre, bardziej poważne dane liczbowe można znaleźć w szeroko cytowanym ostatnio artykule Ferguson i in. (2020). Jak widać, „rosną i opadają, ale daleko od Gaussa, w niektórych symulacjach są nawet multimodalne lub skośne. Oczywiście jest to nadal symulacja, a więc o wiele bardziej uproszczona dystrybucja niż to, czego moglibyśmy oczekiwać na podstawie rzeczywistych danych.
Nie, ale (przy właściwych założeniach, które w praktyce raczej się nie sprawdzą) w pewnym sensie.
Michael Reid wskazuje, że liczba osób zarażonych epidemią w uproszczonych stałych warunkach (stała R0) jest regulowana przez równanie logistyczne, które prowadzi do esicy, funkcji logistycznej. Pochodną funkcji logistycznej jest krzywa gęstości w kształcie dzwonu rozkładu logistycznego, co nie jest normalne, mimo że na pierwszy rzut oka wygląda normalnie. Ponieważ pochodna reprezentowałaby liczbę nowych zakażonych osób w jednostce czasu, a wspólne wskaźniki, takie jak liczba zgonów dziennie lub liczba nowo zgłaszanych przypadków dziennie, są mniej więcej proporcjonalne do opóźnionej i nieokreślonej wersji liczby nowych zakażonych osób, również podążają za krzywą podobną do funkcji gęstości dystrybucji logistycznej.
Jednak niektóre założenia równania logistycznego mogą nie mieć zastosowania w przypadku wybuchu koronawirusa - w rzeczywistości mogą nie mieć zastosowania dla żadnej realnej populacji, chociaż równanie logistyczne jest powszechnym i użytecznym modelem dynamiki populacji:
Wygląda na to, że są tu trzy pytania:
Czy rzeczywisty rozkład przypadków jest Gaussowski? Nie.
Czy krzywe podane w grafice Gaussa? Niezupełnie.Myślę, że czerwona jest trochę przekrzywiona, a niebieska zdecydowanie przekrzywiona.
C Czy wykresy wartości w funkcji czasu można uznać za Gaussa? Tak.
W matematyce funkcja Gaussa, często nazywana po prostu funkcją Gaussa, jest funkcją postaci $$ f (x) = ae ^ {- {\ frac {(xb) ^ {2}} {2c ^ {2}}}} $$ dla dowolnych stałych rzeczywistych a, b i niezerowych c.
https://en.wikipedia.org/wiki/Gaussian_function
Nie jest wymagane, aby był to rozkład prawdopodobieństwa.
Krótka odpowiedź, nie.Zastanawiałem się nad tym samym i znalazłem sposób na wykreślenie populacji podatnych, zakażonych i wyzdrowiałych ludzi.Jest to model zwany przedziałowym modelem epidemiologii, a określony algorytm nosi nazwę algorytm Gillespiego.W drugim linku jest kod Pythona, ale wypróbowałem go w R i wygląda to tak i tutaj jest notatnik, jeśli jesteś zainteresowany.
Wygląda na to, że coś w rodzaju rozkładu Poissona byłoby bliższe, ale w odpowiednich warunkach moglibyśmy przybliżyć rozkład Poissona za pomocą rozkładu normalnego / Gaussa.Taka jest hojna interpretacja.Inne interpretacje to: 1, CDC w rzeczywistości nie zna właściwego kształtu, lub 2, CDC chce go ogłupiać do publicznego spożycia.
Najprostsza analiza epidemii prowadzi do modelu krzywej logistyki.Odsetek nowych infekcji będzie pochodną wszystkich przypadków, które w tym modelu dawałyby krzywą w kształcie dzwonu (normalny pośrodku, ale z dużo grubszymi ogonami - patrz komentarz Dirka poniżej).
Założenia modelu to stałe tempo transmisji, dokładnie tak, jak miałoby to miejsce w przypadku wzrostu wykładniczego, ale w przeciwieństwie do wzrostu wykładniczego istnieje granica nasycenia.W wielu epidemiach granicą nasycenia byłaby cała populacja (tj. Ostatecznie każdy zostałby narażony i nabył odporność).Miejmy nadzieję, że w przypadku COVID-19 tak się nie stanie, więc potrzebne będą pewne zmiany, które pozwolą ograniczyć rozprzestrzenianie się w pewnym podzbiorze całej populacji.
Moim źródłem tego był doskonały film z YouTube 1.(Może jest jakieś lepsze źródło niż youtube?)
Sam nie jestem epidemiologiem, ale inną kluczową różnicą między tą krzywą a krzywą Gaussa jest to, że Gaussian rozpada się do zera stosunkowo szybko (jako $ e ^ {- t ^ 2} $ po pewnym czasie $ t $ ), podczas gdy można się spodziewać, że rzeczywista epidemia będzie zmniejszać się w znacznie wolniejszym tempie pod koniec lub nawetnie rozpadać się do 0 $ , ale do jakiejś innej (miejmy nadzieję niskiej) stałej - tj. wirus może nie wymrzeć całkowicie tak, jak sugeruje krzywa Gaussa.
Nie.Jak do tej pory wykazano tutaj w różnych krajach, rozsądnym sposobem modelowania krzywych daily new potwierdzonych przypadków i zgonów dla Covid-19 jest użycie:
Zobacz na przykład Włochy od 22 kwietnia 2020 r. (z logistyką przed szczytem, wykładniczo po):
Jeśli chodzi o USA, model logistyki jest na razie wystarczający:
Wreszcie w przypadku Chin trudniej jest powiedzieć:
Na wczesnych etapach epidemii wzrost jest wykładniczy.Dwa kluczowe parametry to R0 (średnia liczba osób zarażonych przez każdą złapaną osobę) i czas inkubacji.Celem jest zmniejszenie R0 - gdy spadnie poniżej 1,0, epidemia się kończy.Większość hrabstw nadal znajduje się na tym etapie pod względem COVID-19.
Gdy znaczna część populacji staje się odporna, model wykładniczy nie jest już odpowiedni.Zobacz świetną odpowiedź użytkownika953847 powyżej.
Sextus Empiricus zwraca uwagę, że rzeczywiste dane są nieprawidłowe.Dotyczy to wszystkich prawdziwych danych.Niemniej jednak idealne modele mogą być przydatne jako sposób na znalezienie i zakomunikowanie trendów leżących u podstaw nieprawidłowości.
Biologiczny wzrost (skumulowany) epidemii wirusów, drzew, ludzi lub innych zjawisk biologicznych na ogół podlega funkcji logistycznej: 1 / (1 + e ^ -1). Krzywa logistyczna ma kształt esicy lub litery S. Nie „spłaszcza się”, ale ma punkt przegięcia.
Pierwsza pochodna to stopa wzrostu. Ta krzywa jest zgodna z rozkładem logistycznym. Ma kształt dzwonu jak krzywa Gaussa, chociaż jest inny. F (x) = e ^ -x / (1 + e ^ -x) ^ 2. Szczyt krzywej tempa wzrostu występuje w tym samym czasie (ponieważ oś x to czas) z punktem przegięcia skumulowanej krzywej wzrostu.
Drugą pochodną jest przyspieszenie. Ma z boku kształt litery S, jak fala sinusoidalna przekrzywiona w prawo. Przyspieszenie przechodzi przez oś x (równą zeru), gdy tempo osiąga szczyt i zmienia się skumulowany wzrost. Następnie przyspieszenie jest ujemne (zwalnianie) i po zanurzeniu się w terytorium ujemne asymptotycznie zbliża się do osi X od dołu.
Funkcja Gompertza jest wyspecjalizowanym przypadkiem ogólnej funkcji logistycznej i jest czasami używana do badań wzrostu, ponieważ ma parametry, które można obliczyć za pomocą regresji liniowej. Jednym z parametrów jest górna asymptota skumulowanej krzywej wzrostu. Ten parametr odpowiadałby całkowitej liczbie zgonów lub całkowitej liczbie przypadków, gdyby to było to, co szacujesz.
Czasami używany jest również rozkład Weibulla, inny specjalistyczny przypadek z parametrami. Użyliśmy Weibulla do opracowania tak zwanych modeli wzrostu pojedynczego drzewostanu, kiedy byłem studentem.
To jest matematyka wzrostu. Nie jest „wykładniczy” ani „logarytmiczny”. To jest logistyczne.
W rzeczywistości ta krzywa wydaje się dobrze pasować do odwrotnego rozkładu Gausssowskiego.Ten rozkład jest szeroko stosowany w psychologii lub ekonomii do opisu rozkładu opóźnień czasowych.IANAE (Nie jestem epidemiologiem ©), ale istnieją podobieństwa tych procesów z pandemią (gdzie to, co jest oznaczone na wykresie zmienną $ x $ będzieczas od początku pandemii):
Zauważ, że dla niektórych wartości wygląda to podobnie do rozkładu Gaussa w kształcie dzwonu.Średnia i odchylenie standardowe kontrolują czas wystąpienia piku i „rozłożenie” krzywej.