Pytanie:
Zrozumienie wyników regresji wielorakiej
Sarah
2011-03-17 01:55:08 UTC
view on stackexchange narkive permalink

Jestem studentką pierwszego roku psychologii. Prowadzę prace badawcze z profesorem, niestety materiały, których potrzebuję teraz, są objęte dopiero na moim drugim roku. Ale muszę już to wiedzieć teraz. Dlatego przeglądam wszelkie zasoby, które mogę znaleźć, aby szybko przyspieszyć. Potrzebuję pomocy, aby zrozumieć tę konkretną sytuację tutaj. Obejmuje SAS, analizę regresji.

Kiedy przeprowadziłem regresję w SAS (proc reg) używając dwóch zmiennych, powiedz a i b. Mam to. Rozumiem to jako stwierdzenie, że obie te zmienne (a&b) nie przewidują znacząco mojej zmiennej docelowej. Oto wyjście SAS.

  Analiza wariancji Suma średniego źródła DF Kwadraty Kwadrat Wartość F Pr > F Model 2 3,32392 1,66196 1,00 0,3774 Błąd 46 76,80649 1,66971 Skorygowana suma 48 80,13041 Pierwiastek MSE 1,29217 Kwadrat R 0,0415 Średnia zależna -0,23698 Adj R-Sq -0,0002 Coeff Var -545.26074 Parametr Estymaty Parametr Standardowa zmienna znormalizowana DF Błąd szacunkowy t Wartość Pr > | t | Oszacowanie Punkt przecięcia 1 -0,25713 0,18515 -1,39 0,1716 0 a 1 -0,35394 0,28797 -1,23 0,2253 -0,19510 b 1 -0,04706 0,39586 -0,12 0,9059 -0,01887  

Teraz próbowałem uwzględnić interakcję i b do zdjęcia. Nazwijmy to aXb, teraz wyjście wskazuje, że a i aXb znacząco przewidują moją zmienną docelową.

  Analiza wariancji Suma średniego źródła DF Kwadraty Kwadrat Wartość F Pr > F Model 3 16,64439 5,54813 3,93 0,0142 Błąd 45 63,48602 1,41080 Skorygowana suma 48 80,13041 Root MSE 1,18777 R-Square 0,2077 Zależna średnia -0,23698 Adj R-Sq 0,1549 Coeff Var -501.20683 Szacunki parametrów Parametr Standardowa zmienna znormalizowana DF Szacunkowy błąd t Wartość Pr > | t | Oszacowanie Punkt przecięcia 1 -0,06807 0,18098 -0,38 0,7086 0 a 1 3,01517 1,12795 2,67 0,0104 1,66201 b 1-0,00994 0,36407 -0,03 0,9783 -0,00399 aXb 1 -1,13782 0,37029 -3,07 0,0036 -1,90743  

Oto moje pytania: Nie wiem, co zrobić z tej sytuacji. Podsumowując, co to dla mnie oznacza? Odpowiadając na to pytanie, czy możesz uzupełnić je o jakieś zasoby, słowa kluczowe goog itp., Abym mógł dowiedzieć się więcej na ten temat.

Bardzo dziękuję za pomoc.

Ta dwójka razem nie powie ci nic więcej niż ta druga osoba sama! Główne efekty są nieinteresujące i mylące, gdy występuje interakcja. Drugi model powie Ci wszystko, co musisz wiedzieć. Opisz swoje zmienne dokładniej (czym one są, jakie są ich zakresy, czy są to wartości liczbowe, czy też czynniki?), A ktoś może pomóc Ci pomyśleć o tym, co oznacza / wygląda ta interakcja.
@Brett Jednak wydaje się, że jest tu tajemnica. Według pierwszego modelu wszystkie średnie grupowe są ujemne. Zgodnie z drugim modelem średnie grupowe przy a = 1 są silnie dodatnie. Zastanawiam się, czy zmienne niezależne zostały zakodowane w ten sam sposób w obu obliczeniach ...
a waha się od -1,37 do 2,12, b waha się od -1,03 do 1,3. Obie zmienne są numeryczne. (Muszę powstrzymać się od publikowania, co dokładnie reprezentują a i b w świecie rzeczywistym, ponieważ dane należą do grupy badawczej, a po prostu zaoferowałem pomoc w ulepszeniu mojej wiedzy)
@whuber Nie jest to żadna tajemnica, nie sądzę. Po pierwsze, punkt przecięcia się zmienia. Ponadto termin interakcji może powodować dziwne rzeczy.
@Peter Ze względu na prezentację ANOVA błędnie wyobraziłem sobie, że a i b mogą być binarnymi zmiennymi kategorialnymi, to wszystko. Masz rację, że nie ma tajemnicy, gdy a i b mają zakresy wskazane przez @Sarah.
Cztery odpowiedzi:
Michael Bishop
2011-03-17 03:54:57 UTC
view on stackexchange narkive permalink

Wygląda na to, że potrzebujesz wprowadzenia do regresji. Ludzie polecali książki tutaj. Bezpłatne rekomendacje książek tutaj.

Trudno jest upewnić się, że wykonujesz analizę prawidłowo, gdy nie wiemy, jakie są zmienne lub jaki jest cel. Ale na podstawie wyników mogę powiedzieć, że Twoja druga specyfikacja regresji wygląda lepiej niż pierwsza. Mówię to, ponieważ masz dwa bardzo istotne współczynniki, a skorygowana wartość R ^ 2 miała duży skok. Należy jednak pamiętać, że chociaż rozważam te ważne wskazówki, nie jest prawdą, że modele z bardziej znaczącymi współczynnikami lub wyższym skorygowanym R ^ 2 są konsekwentnie lepsze. Należy wziąć pod uwagę wiele innych kwestii.

Twoje modele regresji przewidują Y, używając a i b. W drugim modelu oszacowane równanie regresji wynosi -0,06807 + (3,01517 * a) - (0,00994 * b) - (1,13782 a b) Innymi słowy, podłącz a i b, a otrzymasz przewidywania modeli dla Y. Mógłbym powiedzieć o wiele więcej, ale zostawię cię tam i zasugeruję, abyś wziął podręcznik.

Zdecydowanie polecam wykreślenie danych. Y z a na osi X, Y z b na osi X, a także z a na b.

Dzięki za link do rekomendacji książek, "Statystyki w prostym języku angielskim" brzmi jak bardzo zachęcający tytuł :) Sprawdzę to.
Zdecydowanie po drugie wykreślam dane. Zobacz http://eagereyes.org/criticism/anscombes-quartet
Zgadzam się z @MichaelBishop - kreślenie jest niezbędne, zwłaszcza gdy dochodzi do interakcji
Brett
2011-03-17 19:42:01 UTC
view on stackexchange narkive permalink

Ta dwójka razem nie powie Ci nic więcej niż ta druga osoba sama! Główne efekty są nieinteresujące i mylące, gdy występuje interakcja. Drugi model powie Ci wszystko, co musisz wiedzieć. Oto kilka wykresów z kodem R, które pomogą Ci zrozumieć, jak wygląda ten drugi model ...

  biblioteka (krata) a <- rep (seq (-1.37, 2.12, (2.12-1.37) / 9), 4) b <- sort (rep (kwantyl (seq (-1,03, 1,30, .01), c (.2, .4, .6, .8)), 10) ) y <- -0,06807 + (3,01517 * a) + (-0,00994 * b) + (-1,13782 * a * b) xyplot (y ~ a | współczynnik (b))  

Effect of a on y by Levels of b

Ten pokazuje szacowany wpływ a na y według poziomów z b . Na każdym poziomie b związek jest pozytywny. To jest twoje znaczące dodatnie nachylenie dla głównego efektu a w obecności interakcji a:b .

  a <- sort (rep (quantile (seq (-1,37, 2,12, .01), c (.2, .4, .6, .8)), 10)) b < - rep (seq (-1,03, 1,30, (1,30--1,03) / 9), 4) y <- -0,06807 + (3,01517 * a) + (-0,00994 * b) + (-1,13782 * a * b) xyplot (y ~ b | czynnik (a))  

Effect of b on y by Levels of a

To jest obrazek przedstawia szacowane efekty b na y na poziomach a . Możesz zobaczyć, dlaczego nie masz znaczącego głównego efektu dla b . Kierunek relacji y~b zależy od poziomu a . Zatem nie ma niezależnej relacji (wyobraź sobie uśrednianie tych linii), ale znacząca interakcja (wyraźny wzorzec, jeśli weźmiesz pod uwagę poziom a )

tflutre
2011-03-17 09:08:34 UTC
view on stackexchange narkive permalink

Może Cię zainteresować to wprowadzenie do modelu liniowego (podstawa prawie wszystkich analiz statystycznych), aw szczególności regresja liniowa:

  • dokładnie wyjaśnia wiele matematycznych aspektów regresji liniowej , szczegółowo opisując wszystkie ważne równania (które zwykle pozostawia się do ćwiczenia w każdym innym miejscu w Internecie);
  • używa prosty, ale wystarczająco pouczający, zbiór danych jako przykład ;
  • i zawiera wszystkie polecenia R wymagane do wykonania obliczeń krok po kroku, a także wykreślić wyniki.
Peter Flom
2011-03-17 15:33:45 UTC
view on stackexchange narkive permalink

Jeśli potrzebujesz książki poświęconej konkretnie tego rodzaju regresji - w przeciwieństwie do ogólnej analizy danych - polecam Analiza regresji na przykładzie autorstwa Chatterjee i Price. Dobre, nie techniczne, ale nie upraszcza zbytnio.



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 2.0, w ramach której jest rozpowszechniana.
Loading...