Pytanie:
Testy statystyczne przy wielkości próby 1
Brent Parker
2020-04-28 07:56:21 UTC
view on stackexchange narkive permalink

Jestem nauczycielem matematyki w liceum, który jest trochę zakłopotany.Student biologii przyszedł do mnie ze swoim eksperymentem, chcąc wiedzieć, jakiego rodzaju analizę statystyczną może przeprowadzić ze swoimi danymi (tak, powinien był zdecydować, że PRZED eksperymentem, ale konsultowano się ze mną dopiero po nim).

Próbuje ustalić, jaki wpływ ma insulina na stężenie glukozy w hodowli komórkowej.Istnieje sześć kultur pogrupowanych w trzy pary (jedna z insuliną i jedna bez), każda w nieco innych warunkach.

Problem polega na tym, że z każdego wziął tylko jedną próbkę, więc nie ma odchylenia standardowego (lub odchylenie standardowe wynosi 0, ponieważ wartość różni się od siebie o 0).

Czy jest jakaś analiza statystyczna, którą może przeprowadzić z tymi danymi?Jaką radę powinienem mu dać, jeśli nie powtórzyć eksperymentu?

Myślę, że jest to ciekawe pytanie, ale niestety tylko dlatego, że podejrzewam, że odpowiedź brzmi „niewiele” (bo nie ma wiele do zrobienia poza powtórzeniem eksperymentu) i byłbym bardzo zainteresowany, gdyby ktoś był w stanieaby udzielić odpowiedzi zawierającej więcej treści.
Po prostu zdobądź więcej danych, albo musi porównać 3 z 3.
Jeśli jesteś przygotowany na zajęcie Bayesowskiego punktu widzenia, to jest pewna nadzieja, ale w liceum jest to bardzo skomplikowane do wprowadzenia ucznia (i to degraduje rygor procesu naukowego, ponieważ chcesz, aby eksperyment zademonstrowałefekty niezależnie od Twoich wcześniejszych przekonań)
Coś mi tu brakuje: jeśli chce ocenić stężenie glukozy, dlaczego którakolwiek z par podlega ** jakimkolwiek ** innym warunkom poza poziomem glukozy?Jeśli jedynym „innym warunkiem” jest w rzeczywistości poziom glukozy, może sporządzić ładny wykres próbek i przynajmniej zgadnąć, czy jest on liniowy, kwadratowy itp.
Poszukaj też nauczyciela biologii * i uderz go wskazówką-by-4.
Odniosłem wrażenie, że nie konsultowano się z nauczycielem biologii poza wyjaśnieniem tematu.To on wysłał do mnie ucznia, ponieważ on też nie wiedział, co zrobić z danymi. Jeśli chodzi o projekt eksperymentu, ma trzy pary grup: grupę kontrolną (tylko pożywka bez hodowli komórkowej), kultury komórkowe, których składniki odżywcze nie są uzupełniane przez cały eksperyment (myślę, że po prostu dodał wodę, aby utrzymać stałą objętość ...nie jestem pewien, nie przeczytałem całej procedury) oraz kultury komórkowe, których składniki odżywcze były okresowo uzupełniane.
W każdej parze jedna również otrzymywała insulinę, a druga nie.Okresowo pobierał po jednej próbce z każdego i mierzył stężenie glukozy, aby mieć jakieś pojęcie o stężeniu w czasie.
Odchylenie standardowe byłoby nieokreślone, a nie 0 $, tak jak $ \ frac {0} {0} $ jest nieokreślone, a nie 0 $. $
Jakie dokładnie liczby zbiera ten uczeń?Na przykład, czy mają 3 zestawy danych stężenia glukozy dla insuliny vs. bez insuliny?Czy są to, powiedzmy, molowe stężenia glukozy po ustaleniu przez kultury standardowego czasu?Czy uczeń ma jakąś hipotezę dotyczącą wpływu insuliny na kultury?
Zebrał stężenie glukozy w mg / dl.Przykładem jego danych jest Insulina grupy kontrolnej +: 551 mg / dl Insulina grupy kontrolnej: 534 mg / dl Odnowiona pożywka Insulina +: 530 mg / dl Insulina pożywka odnowiona: 514 mg / dl Media Nonrenewed Insulin +: 426 mg / dl Pożywka Nonrenewed Insulin-: 413 mg / dl Swoje próbki zebrał po 30 minutach i ponownie po 24 godzinach. Jeśli chodzi o hipotezę, nie widzę, gdzie jest konkretnie wymieniona w jego artykule, ale osobiście powiedział, że komórki w kulturach z insuliną bardziej zmniejszyłyby stężenie glukozy.
Osiem odpowiedzi:
Stephan Kolassa
2020-04-28 12:04:25 UTC
view on stackexchange narkive permalink

Niestety, Twój uczeń ma problem.

Ideą jakiejkolwiek (wnioskowej) analizy statystycznej jest zrozumienie, czy wzorzec obserwacji może być po prostu wynikiem naturalnej zmienności lub przypadku, czy też jest coś systematycznego tam. Jeśli naturalna zmienność jest duża, to zaobserwowana różnica może być po prostu przypadkowa. Jeśli naturalna zmienność jest niewielka, może to wskazywać na prawdziwy efekt podstawowy.

Mając tylko jedną parę obserwacji, nie mamy pojęcia o naturalnej zmienności obserwowanych danych. Więc brakuje nam połowy potrzebnych nam informacji.

Zauważasz, że twój uczeń ma trzy pary obserwacji. Niestety zebrano je w innych warunkach. Tak więc zmienność, którą obserwujemy między tymi trzema parami, może po prostu wynikać z różnych warunków i nie pomoże nam w rozwiązaniu podstawowego pytania o możliwy wpływ insuliny.

Jedyną słomką do uchwycenia byłoby zrozumienie naturalnej zmienności innymi kanałami. Być może podobne obserwacje w podobnych warunkach zostały poczynione wcześniej i opisane w literaturze. Jeśli tak, moglibyśmy porównać nasze obserwacje z opublikowanymi danymi. (To nadal byłoby problematyczne, ponieważ protokoły prawie na pewno byłyby nieco inne, ale może być lepsze niż nic).

EDYTUJ: zwróć uwagę, że moje wyjaśnienie tutaj dotyczy przypadku, w którym stan ma potencjalny wpływ na działanie insuliny, interakcja . Jeśli możemy zignorować tę możliwość i oczekiwać tylko głównych efektów (tj. Stan będzie miał addytywny wpływ na glukozę, który jest niezależny od dodatkowego wpływu insuliny), to możemy przynajmniej formalnie przeprowadzić ANOVA zgodnie z odpowiedzią BruceET. To może być najlepsze, co student może zrobić. (I przynajmniej ćwiczą zapisywanie ograniczeń swojej nauki, co jest również ważną umiejętnością!)

W przeciwnym razie obawiam się, że jedyną możliwością byłby powrót na stół laboratoryjny i zebranie większej ilości danych.


W każdym razie jest to (prawdopodobnie bolesna, ale wciąż) wspaniała okazja do nauki!Jestem pewien, że ten student w przyszłości zawsze będzie myślał o analizie statystycznej przed planowaniem swoich badań, a tak powinno być.Lepiej uczyć się tego w szkole średniej niż tylko na studiach.

Zakończę trafnym cytatem przypisywanym Ronaldowi Fisherowi:

Skonsultowanie się ze statystykiem po zakończeniu eksperymentu często sprowadza się do poproszenia go o przeprowadzenie sekcji zwłok.Może może powiedzieć, na co poległ eksperyment.

Po rozmowie ze mną student postanowił powtórzyć swój eksperyment z lepszymi technikami i metodologią zbierania danych.To błąd, o którym nie sądzę, że znowu się powtórzy.Dzięki za przemyślaną odpowiedź.
BruceET
2020-04-28 12:02:46 UTC
view on stackexchange narkive permalink

T Dwukierunkowa ANOVA z jedną obserwacją na komórkę

Po zakończeniu ważnego „wykładu” na temat konsultacji ze statystykiem przed rozpoczęciem zbierania danych możesz powiedzieć uczniowi, że jest ledwo wystarczająca ilość danych tutaj, aby wspierać legalny projekt eksperymentalny.

Jeśli tematy zostały wybrane losowo z odpowiednich populacji, oznaczenia glukozy dokonano w w ten sam sposób dla każdego z sześciu badanych i jeśli poziomy glukozy mają rozkład normalny, wydaje się możliwe przeanalizowanie wyników zgodnie z prostym dwukierunkowa ANOVA z jedną obserwacją na komórkę.

Dane mogą zostać wyświetlone w postaci tabeli, takiej jak ta:

  Insulina
             --------------
Metoda Tak Nie
---------------------------
     1
     2
     3
 

Model to $ Y_ {ij} = \ mu + \ alpha_i + \ beta_j + e_ {ij}, $ gdzie $ i = 1,2,3 $ metody; $ j = 1, 2 $ warunki (T lub N), i $ e_ {ij} \ stackrel {iid} {\ sim} \ mathsf {Norm} (0, \ sigma). $ Możesz spojrzeć na statystyki dla średnio zaawansowanych szczegółowe informacje na temat tekstu lub tekstu wprowadzającego projektu eksperymentalnego.

dwukierunkowy projekt ANOVA pozwoliłby na to test, czy oba stany mają różne poziomy glukozy poziom (prawie na pewno tak, jeśli dawki insuliny są znaczące) i czy te trzy metody różnią się, czy też są takie same.

Mając tylko dwa poziomy jednego czynnika, tylko dwa poziomy drugiego i tylko jedną obserwację na komórkę, nie byłoby możliwe uwzględnienie interakcji między dawką insuliny a metodą. [W powyższym modelu nie ma terminu $ (\ alpha * \ beta) _ {ij} $ ; miałby takie same indeksy dolne jak termin błędu $ e_ {ij}.] $

Poza tym prawdopodobnie nie warto byłoby wykonywać żadnych nieparametrycznych działań test (z więcej niż trzema metodami - być może test Friedmana). Że dlatego powyżej wyraźnie wspomniałem o normalności.


Przykład użycia fałszywych danych w R:

  gluc = c (110, 135, 123, 200, 210, 234)
met = as. współczynnik (c (2, 2, 3, 1, 2, 2))
insl = as.factor (c (1, 1, 1, 2, 2, 2))
aov.out = aov (gluk ~ met + insl)
podsumowanie (aov.out)
             Df Sum Sq Średnia Sq Wartość F Pr (>F)
met 2 3119 1559 5,193 0,161
dop. 1 9900 9900 32,973 0,029 *
Pozostałości 2600300
---
Signif. kody: 0 „***” 0,001 „**” 0,01 „*” 0,05 „.” 0,1 „” 1
 

Efekt insuliny istotny na poziomie 3%

Możesz również użyć tylko sparowanej glukozy pomiary insuliny (T / N) w sparowanym teście t, aby uzyskać wynik znaczący wynik. (W ANOVA Metody zapewniają trochę interakcji, której nie można przetestować ponieważ jest tylko jedna obserwacja na komórkę.)

  t.test (gluc ~ insl, pair = T)

        Sparowany test t

dane: gluk wg insl
t = -8,812, df = 2, wartość p = 0,01263
alternatywna hipoteza:
  prawdziwa różnica średnich nie jest równa 0
95-procentowy przedział ufności:
 -136,92101 -47,07899
przykładowe szacunki:
średnia różnic
                    -92
 

Uwaga: zobacz to demo, aby zobaczyć 2 $ \ times 3 $ ANOVA z kilkoma replikacjami na komórkę, przeanalizowane szczegółowo.

Nie sądzę, żeby to było bardzo pomocne.Mamy sześć obserwacji i sześć stopni swobody.Dopasowanie będzie idealne, błędy będą wynosić zero, a nasze ANOVA podzielą zero przez zero.
@StephanKolassa: Jest to 1 DF dla warunku, 2 DF dla met, 2 DF dla błędu.Raczej nie jest idealny, ale będzie działał w oprogramowaniu, chyba że będzie za dużo powiązań.// Właśnie dodałem przykład i link.// Ale rada Sir Ronalda wydaje się odpowiednia.
Tak, widzę.Nieświadomie myślałem o interakcjach.Jeśli je zignorujemy, twój punkt widzenia jest ważny.To nie jest tak, że uczeń ma duży wybór.Pozwól mi edytować moją odpowiedź ...
(+1) Chociaż nie jest to idealne, dlaczego sparowany $ t $ -test nie jest tutaj oczywistą rzeczą?„Metoda” wydaje się zbędna w pytaniu badawczym.Doceniam, że jeśli wchodzi w interakcję z działaniem insuliny, mamy personel, ale to jest inne ustawienie.
Ponieważ jest tu tak mało danych, żaden test nie jest idealny.Spośród miernych dostępnych wyborów, sparowane-t jest w porządku, myślę, że dwukierunkowa ANOVA jest lepsza, ponieważ w testach na insulinę (T / N) zapewnia ochronę przed możliwą niszczycielską zmiennością między metodami. // Nieparametryczna alternatywa dla sparowanego t jest częstoTest Wilcoxon SR na różnicach, ale to jest poza tabelą, ponieważ ten test _ nigdy_ nie może odrzucić na poziomie 5% z tylko 3 różnicami.Z podobnych, nieco bardziej skomplikowanych powodów, test Friedmana również byłby tutaj nieodpowiedni.
Fajne dzięki.Zgadzam się z tym, że napisałeś na odpowiedzi i przy tym komentarzu, nieparametryczny jest oczywiście poza stołem i oczywiście doceniam również, że wszystkie opcje są nieoptymalne.Najpierw wykonałbym parę $ t $ -pierwszy i unikałbym dwuczynnikowej ANOVA, ponieważ kojarzę ANOVA z interakcją, ale tak, teraz wyraźniej widzę twój punkt widzenia.
Wspomniałem w komentarzu do AlaskaRon, że student zdecydował się powtórzyć swój eksperyment z lepszymi technikami i metodologią próbkowania, ale nadal będę wskazywał mu ten wątek.Twoja odpowiedź była dokładna i wnikliwa i miejmy nadzieję, że nauczy ucznia.Dzięki, BruceET
AlaskaRon
2020-04-29 00:10:00 UTC
view on stackexchange narkive permalink

BruceET opisał właściwą analizę (dwukierunkowa ANOVA bez interakcji), więc przedstawię eksperyment bardziej pozytywnie.

Zakładam, że projekt obejmował trzy pary, w których występuje zmienność między parami. Jedna para otrzymała insulinę, a druga bez, miejmy nadzieję, że została ona randomizowana. Następnie każdą próbkę (traktowanie parą X, jednostkę eksperymentalną nazywam petrie) mierzono raz.

1) To nie jest zły projekt. Jest to prawdopodobnie jeden z najczęściej stosowanych projektów eksperymentalnych w nauce - jest to projekt pełnego bloku (nazywany również projektem dopasowanych par, gdy bloki mają tylko dwie obserwacje). Ten projekt generalnie ma lepszą moc niż jeszcze bardziej powszechny całkowicie losowy projekt (wszystkie sześć jednostek eksperymentalnych zostało losowo przydzielonych do zestawu trzech, które otrzymały insulinę, a trzy, które jej nie otrzymały). Projekt sparowany eliminuje zmienność spowodowaną zmiennością par. Poważnie, ten projekt jest wszechobecny w rolnictwie, medycynie itp. Jedyny zarzut, jaki miałbym, to to, że trzy pary mogą pozwolić na zbyt małą moc. Ale z pewnością jest replikowany (jest wiele par).

2) Wydaje się, że sugestia była taka, że ​​uczeń powinien był wielokrotnie pobierać próbki z każdego petrie, aby uzyskać replikacje. To byłaby bardzo zła rekomendacja. Przykładem pseudoreplikacji jest wielokrotne próbkowanie każdej jednostki eksperymentalnej w celu uzyskania replikacji. Jeśli pseudo-powtórzenia są uśredniane razem, aby uzyskać jeden pomiar na szalkę Petriego, możesz nieco obniżyć zmienność, ale w ogóle nie uzyskasz stopni swobody w analizie. Podpróbki nie są niezależne. Więc dobrze, że tego nie poleciłeś.

UWAGA: Tak, w przypadku tego projektu nie można uzyskać oszacowania interakcji kultura: leczenie. Ale tak jest również w przypadku, gdyby został zaprojektowany jako całkowicie losowy projekt. Interakcja kończy się szumem.

PODSUMOWANIE: Projekt jest w rzeczywistości klasycznym projektem eksperymentalnym, wysoce zalecanym do tego rodzaju badań.Jest również łatwy do analizy.Jedynym zastrzeżeniem byłoby to, że trzy pary mogą być zbyt słabe.

Wielkie dzięki.Wskażę uczniowi cały ten wątek, aby dać mu więcej pomysłów.Po dłuższej dyskusji zdecydował się powtórzyć swój eksperyment z lepszą metodologią, ale nadal uważam, że ta dyskusja będzie pomocna.
Mówisz, że jest to typowy projekt (i że występuje replikacja), ale tak jest w przypadku, gdy bloki / warunki mają być traktowane jako czynnik * losowy *.
Josh S.
2020-05-15 18:59:03 UTC
view on stackexchange narkive permalink

Wspaniałe pytanie, które ma historyczny precedens. O ile moglibyśmy winić naszego początkującego młodszego naukowca z liceum za jego eksperymentalny projekt, ma on niemal doskonały precedens historyczny.

To, co niektórzy uważają za pierwszy kontrolowany naukowy eksperyment medyczny, spowodowało to samo. Ten licealista przetestował 3 sytuacje z placebo lub interwencją. Lekarz James Lind na pokładzie HMS Salisbury zrobił to samo w swoim słynnym odkryciu leczenia szkorbutu. Postawił hipotezę, że szkorbut można leczyć kwasami. Więc wymyślił sześć kwasów i podał po jednym dla każdego z 6 marynarzy dotkniętych szkorbutem, podczas gdy każdy miał taką samą pojedynczą kontrolę dla sześciu innych, którzy go nie otrzymali. Było to w zasadzie sześć jednoczesnych kontrolowanych prób z interwencją na 1 osobie i bez interwencji na innej. W sumie 12 marynarzy, 6 leczonych, 6 nieleczonych. Interwencje obejmowały „cydr, rozcieńczony kwas siarkowy, ocet, wodę morską, dwie pomarańcze i cytrynę lub mieszankę przeczyszczającą”. Jakże jesteśmy szczęśliwi, że jedyny żeglarz, który dostał cytrusy, nie umarł przypadkowo na coś innego. Reszta, jak mówią, to historia. Słyszałem to omówione w kilku podcastach, więc znałem tę historię. Oto cytat, który znalazłem podczas szybkiego wyszukiwania w Internecie. Może nie jest to najlepsze źródło, ale pomoże Ci zacząć, jeśli chcesz przeczytać więcej.

James Lind i Scurvy

- JS

Ed Rigdon
2020-04-28 23:43:23 UTC
view on stackexchange narkive permalink

Jeśli uczeń byłby skłonny do bardziej szczegółowego zanurkowania, można skierować jego zainteresowanie ze zmienności próbkowania na niepewność i z testu hipotezy na rozszerzony przedział niepewności.Zmienność próbkowania jest tylko jednym ze składników niepewności.Chociaż uczeń nie jest w stanie ocenić zmienności próbkowania, może się czegoś nauczyć, próbując oszacować niepewność związaną z ich pomiarami.Wyobrażam sobie, że twój uczeń nie jest gotowy na inwestycję, ale to sugestia.

Twój link (do Przewodnika po wyrażaniu niepewności pomiaru, czyli GUM) nie jest naprawdę odpowiedni.OP jest zainteresowany tym, „jaki wpływ ma insulina”.Można oszacować wielkość tego efektu i niepewność tego oszacowania.Nie jest jednak jasne, czy takie oszacowanie jest pomiarem w rozumieniu GUM, ani że można by użyć technik GUM do oszacowania jego niepewności.
AJKOER
2020-04-30 00:58:21 UTC
view on stackexchange narkive permalink

Głównym problemem jest mała wielkość próby zmniejszająca stopnie swobody w wyborze modelu wraz z wymaganą / wrażliwością modelu na założenie o normalności błędu. Wydaje się, że najlepszą drogą wydaje się zachowanie stopni swobody i solidność metodologii. Radziłbym nawet generowanie losowych błędów z możliwych rozkładów nadrzędnych i ze znajomością rzeczywistych wartości parametrów, zwracanie uwagi na zmienność szacowanych wartości parametrów i możliwe zmiany w wynikach testów.

W związku z tym proste podejście modelu oszczędnego byłoby pierwszym umieszczeniem danych w formacie regresji zgodnie z następującym zredukowanym modelem w zmiennej Methods:

$$ Y_ {i, j} -Ymedian = \ beta * InsulinDummy_i + \ gamma * MethodDummy_j + \ varepsilon_ {i, j} $$

gdzie zmienną zależną jest obserwowane stężenie glukozy wyśrodkowane wokół mediany populacji, a zmienna manekina insuliny (również wyśrodkowana) wynosi 1/2, jeśli insulina jest obecna w badanej próbce i, w przeciwnym razie -1/2. Zmienna Method Dummy wynosi 2/3 dla metody 1, w przeciwnym razie -1/3 dla metody 2&3 (powtórz analizę, zamień metodę 1 na powiedzmy metodę 2 i powtórz ponownie, zamieniając metodę 2 na metodę 3).

Uwaga: proponowana interpretacja modelu współczynników regresji jest taka, że ​​może pomóc w dokładnym określeniu, po której stronie mediany przypadnie obserwacja. Biorąc pod uwagę niewielki rozmiar próby, proponuję interpretację probabilistyczną ( nawet bayesowską), której dokładność można ocenić w symulowanym testowaniu modelu.

Następnie wprowadzenie solidnej analizy regresji, w której opcją jest najmniejsze odchylenia bezwzględne (LAD). Matematycznie LAD jest powiązany z rozkładem składników błędów Laplace'a. Można obliczyć współczynniki wykorzystując iteracyjne ważone metodą najmniejszych kwadratów lub, szczególnie w obecnym kontekście z 6 punktami danych, wykorzystując właściwość, że parametry modelu wyznaczają linię prostą przechodzącą przez dwa z obserwowanych punktów w przestrzeni. Oznacza to badanie permutacji i testowanie całkowitej sumy bezwzględnych odchyleń. Wybrane punkty prawie zawsze unikają wartości odstających (w przeciwieństwie do najmniejszych kwadratów, gdzie ANOVA opiera się również na kryterium błędu kwadratu).

Aby uzyskać przedziały ufności dla parametrów, zasugerowano ponowne próbkowanie składników błędnych metodą ładowania początkowego ( zobacz to), które można również ocenić na podstawie dokładności przebiegów symulacji.

[EDYTUJ] Uważam, że mój model jest wart dalszych badań, więc zbudowałem model symulacyjny oparty na arkuszu roboczym (wygodny dla iteracyjnej iteracji LAD, która obejmuje badanie przesunięcia punktu, które punkty bezwzględne błędy są zbieżne do zera (wskazujące na par określających linię regresji LAD) .Oto podsumowanie kilkunastu przebiegów symulacji opartych na jednolitym (-0,5 do +,5) błędzie dodanym do modelu zaproponowanego powyżej.

Rzeczywiste bazowe wartości symulowanego parametru to: 1,250 i 0,100

Wartości przebiegu symulacji:

Średnie zaobserwowane wartości 1,225 0,026

Zaobserwowana mediana 1,224 0,045

Uruchom 1 1.001 0.324

Uruchom 2 1,546 0,297

Uruchom 3 1.350 -0.038

Uruchom 4 1.283 -0.115

Uruchom 5 1.593 -0.113

Uruchom 6 1.498 -0.089

Uruchom 7 0.863 0.151

Uruchom 8 1.090 0.323

Uruchom 9 1.102 -0.435

Uruchom 10 1.166 -0.265

Uruchom 11 1.451 0.128

Uruchom 12 0.761 0.146

Moje wyniki są takie, że uzyskane statystyki podsumowujące są niesamowite dla mojego proponowanego modelu parsimonous opartego na 6 punktach z jednolitym rozkładem błędów, szacującym 2 parametry na modelu skoncentrowanym na danych, wykorzystującym silną regresję.Poszczególne przebiegi wyświetlają, zgodnie z oczekiwaniami, całkiem spory zakres wartości parametrów, ale wydaje się, że bardziej prawdopodobne jest, że wskazują na efekt większy niż 1 dla pierwszego parametru (tylko 2 z 12 to mniej niż 1).

Philip Oakley
2020-05-13 15:29:45 UTC
view on stackexchange narkive permalink

Chociaż student nie ma pomiarów powtarzalności typu A, student może / powinien być w stanie oszacować wkład błędu typu B spowodowany sprzętem dostarczonym z innego miejsca („W przypadku oszacowania xi wielkości wejściowej Xi, której nie uzyskano z powtarzających się obserwacji ”).

Jest to szczegółowo opisane w SI / bipm Guide to Uncertainty in Measurement (istnieje odpowiednik NIST).

To przynajmniej pozwala na dokonanie jakiejś oceny wyników

Alternatywą, jeśli uczeń przeprowadził pomiar szeregów czasowych (wspomniany w jednym z komentarzy), jest oszacowanie gładkiego kształtu krzywej, a tym samym błędu pomiaru na podstawie tego gładkiego kształtu.

I wreszcie, gdyby wszystkie grupy kontrolne były faktycznie takie same (co nie wynika z komentarzy), mogłyby utworzyć jedną grupę do oszacowania szumu pomiarowego.

Na koniec użyj tego jako „sekcji zwłok”, aby określić poziom dokładności pomiaru, który byłby wymagany do potwierdzenia hipotezy o zagrożeniu, a tym samym prawdopodobną liczbę powtórzeń pomiarów potrzebnych do uzyskania tej dokładności (błąd w średnia), przy określonych poziomach podstawowej dokładności (błąd pojedynczego pomiaru). To przynajmniej ratuje ucznia przed poczuciem, że to kompletna strata (czyli coś, czego się nauczył!).

AlainD
2020-05-15 13:03:55 UTC
view on stackexchange narkive permalink

Cóż za dobry przykład starej kwestii odchylenia i przypadkowych błędów w błędach obserwacji.

Jeśli fektywna ocena odchylenia standardowego wynosi, jak wspomniałeś:

    $ \ sigma = \ sqrt {\ frac {\ sum {(x_i- \ bar {x}) ^ 2}} {n}} = \ frac {0} { 1} = 0 $ ,

fiektywna ocena to

    $ \ sigma = \ sqrt {\ frac {\ sum {(x_i- \ bar {x}) ^ 2}} {n-1}} = \ frac {0 } {0} = undefined $ .

Więc jeśli nawet Tobie uda się wyciągnąć jakieś wnioski statystyczne, będą one miały nieznany błąd.

Nie przeszkodziło to jednak Studentowi zaprojektować t -test, a Fisher zaprojektować metodę ANOVA dla takich sytuacji.

A gdyby tak zacząć od narysowania trzech par na wykresie punktowym, a następnie przeprowadzić regresję liniową, spojrzeć na nachylenie i porównać z jego standardowym błędem?

Jest to równoznaczne z odpowiedzią BruceET, być może nieco bardziej geometryczną i intuicyjną.



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 4.0, w ramach której jest rozpowszechniana.
Loading...