Jedno zdanie wyjaśnienie AIC dla typów nietechnicznych

Pytanie:

rosser

2012-03-05 17:23:29 UTC

view on stackexchange narkive permalink

Potrzebuję jednozdaniowego wyjaśnienia zastosowania AIC w budowaniu modeli. Do tej pory mam „Mówiąc najprościej, AIC jest względną miarą ilości obserwowanych odchyleń uwzględnionych w różnych modelach i pozwala skorygować złożoność modelu”.

Każda rada bardzo ceniona.

Siedem odpowiedzi:

Peter Flom

2012-03-05 18:13:57 UTC

view on stackexchange narkive permalink

AIC to liczba, która jest pomocna przy porównywaniu modeli, ponieważ zawiera miary zarówno tego, jak dobrze model pasuje do danych, jak i jak skomplikowany jest model.

gung - Reinstate Monica

2012-03-05 22:49:04 UTC

view on stackexchange narkive permalink

To, co byłoby najlepszym wyjaśnieniem, zależy od tego, co dokładnie rozumie się przez „typy nietechniczne”. Podobają mi się wypowiedzi, które zostały zaproponowane do tej pory, ale mam jedno zastrzeżenie: mają tendencję do używania terminu „złożony”, a to, co dokładnie to rozumie, może się różnić. Pozwólcie, że przedstawię tę odmianę:

AIC jest miarą tego, jak dobrze model pasuje do zbioru danych, dostosowując jednocześnie zdolność tego modelu do dopasowania do dowolnego zbioru danych, czy czy nie jest to powiązane.

+1. Myślę, że to jest klucz: kiedy jest * bardziej * elastyczny * zbyt * elastyczny? Być może „dostosowywanie się do” można przeformułować jako „karanie”? Jest to więc coś w rodzaju: „AIC jest miarą tego, jak dobrze model pasuje do zbioru danych, co karze modele, które są tak elastyczne, że pasowałyby również do niepowiązanych zestawów danych”.

Zgadzam się, że zależy to od tego, co rozumie się przez „typy nietechniczne”. Większość osób, z którymi pracuję, ma doktoraty z nauk społecznych, medycznych lub behawioralnych; są wykształceni, ale nie znają statystyk. Ale nie jestem pewien, czy podoba mi się kilka ostatnich słów z twojej definicji, ponieważ nie jest jasne, co oznacza tutaj „pokrewny”. Może w mojej definicji mógłbym podstawić „liczbę zmiennych niezależnych” zamiast „złożonego”. Myślę, że wiele osób wie, co to jest kroplówka ... Ciekawe pytanie!

@PeterFlom, masz rację - zamieniamy jedno możliwe zamieszanie na inne. Osobiście, kiedy wiesz, z kim rozmawiasz, wątpię, czy którekolwiek z nas miałoby jakiekolwiek problemy. Wymóg jednego zdania też jest dość wąski; podaj kilka liczb i 5 minut, a mogę zabrać każdego na pokład. Żeby było jasne, to nie była krytyka, podobała mi się twoja odpowiedź i zagłosowałem za nią.

Dimitriy V. Masterov

2012-03-06 03:53:23 UTC

view on stackexchange narkive permalink

Oto definicja, która lokalizuje AIC w menażerii technik używanych do wyboru modelu. AIC to tylko jeden z kilku rozsądnych sposobów na uchwycenie kompromisu między dobrem dopasowania (który jest ulepszany poprzez dodanie złożoności modelu w postaci dodatkowych zmiennych objaśniających lub dodanie zastrzeżeń typu „ale tylko w czwartek, kiedy pada” ) i oszczędność (prostsze == lepsze) w porównywaniu niezagnieżdżonych modeli. Oto drobny druk:

Uważam, że definicja OP ma zastosowanie tylko do modeli liniowych. W przypadku rzeczy takich jak probity AIC są zwykle definiowane w kategoriach logarytmicznego prawdopodobieństwa.
Niektóre inne kryteria są dostosowywane $ R ^ {2} $ (co ma najmniejszą korektę dla dodatkowych zmiennych objaśniających), Kullback- Leibler IC, BIC / SC, a nawet bardziej egzotyczne, jak kryterium przewidywania Amemiya, rzadko spotykane w dziczy pracy stosowanej. Kryteria te różnią się pod względem tego, jak ostro penalizują złożoność modelu. Niektórzy argumentowali, że AIC ma tendencję do wybierania modeli, które są przeparametryzowane, ponieważ kara za rozmiar modelu jest dość niska. BIC / SC zwiększa również karę wraz ze wzrostem wielkości próbki, co wydaje się przydatną funkcją.
Dobrym sposobem na uniknięcie udziału w amerykańskim kryterium Top Information Criterion jest przyznanie, że kryteria te są arbitralne a ich wyprowadzanie wymaga znacznych przybliżeń, zwłaszcza w przypadku nieliniowym. W praktyce wybór modelu z zestawu modeli powinien prawdopodobnie zależeć od zamierzonego zastosowania tego modelu. Jeśli celem jest wyjaśnienie głównych cech złożonego problemu, oszczędność powinna być na wagę złota. Jeśli podstawą gry jest przewidywanie, oszczędność powinna być mniej ważna. Niektórzy dodaliby nawet, że teoria / wiedza dziedzinowa powinna również odgrywać większą rolę. W każdym razie to, co planujesz zrobić z modelem, powinno określić, jakiego kryterium możesz użyć.
W przypadku modeli zagnieżdżonych wystarczy standardowy test hipotezy ograniczający parametry do zera.

sparc_spread

2012-03-05 17:35:42 UTC

view on stackexchange narkive permalink

Co powiesz na:

AIC pomaga znaleźć najlepiej dopasowany model, który wykorzystuje najmniejszą liczbę zmiennych.

Jeśli to za daleko -kierunek techniczny, daj mi znać w komentarzach, a wymyślę inny.

AIC implementuje brzytwę Ockhama?

@Dilip - tak daleko poza linią, nie możesz już nawet zobaczyć linii - lol, dzięki. Myślę, że użyję czegoś pomiędzy Peterem a moim.

John

2012-03-05 19:41:30 UTC

view on stackexchange narkive permalink

AIC jest miarą tego, jak dobrze dane są wyjaśniane przez model skorygowany ze względu na złożoność modelu.

Wayne

2012-03-06 00:13:51 UTC

view on stackexchange narkive permalink

Druga strona doskonałej odpowiedzi @ gung:

AIC to liczba, która mierzy, jak dobrze model pasuje do zbioru danych, w ruchomej skali, która wymaga bardziej skomplikowanych modeli, aby były znacznie bardziej dokładne, aby uzyskać wyższą ocenę.

EDYCJA:

AIC to liczba, która mierzy, jak dobrze model pasuje do zbioru danych, w skali ruchomej, która wymaga modeli które są znacznie bardziej rozbudowane lub elastyczne, aby były również znacznie dokładniejsze.

+1, to dobrze, ale szczerze mówiąc, bardziej podoba mi się twoja sugestia dotycząca kar. Mogę sobie wyobrazić ludzi, którzy nie rozumieliby, co masz na myśli, mówiąc „wyszukane”.

@gung: Zgadzam się, że to nie całkiem wystarcza, ale próbowałem wypełnić lukę od „modeli” do „wyjaśnień”, gdzie ludzie mogą sobie wyobrazić, że bardziej złożone wyjaśnienie musiałoby być dokładniejsze, aby uzasadnić dodatkowe słowa.

Jean-Victor Côté

2012-03-06 02:22:07 UTC

view on stackexchange narkive permalink

Niech k będzie liczbą parametrów modelu, a MaxL będzie maksymalną wartością funkcji wiarygodności. Następnie kryterium informacyjne Akaike jest zdefiniowane jako $ AIC = 2k-2 \ ln \ left (MaxL \ right) $. Celem jest znalezienie modelu, który minimalizuje AIC.

Biorąc pod uwagę tę definicję, AIC jest kryterium używanym do wyboru modelu, który daje najlepszy kompromis między rzadkością liczby parametrów a maksymalnym prawdopodobieństwem oszacowanie tych parametrów.

ⓘ

To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.

o nas - informacje prawne