Általánosított legkisebb négyzetek

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2015. október 24-én áttekintett verziótól ; az ellenőrzések 4 szerkesztést igényelnek .

A Generalized Least Squares ( GLS , GLS )  egy módszer a regressziós modellek paramétereinek becslésére ,  amely a klasszikus legkisebb négyzetek módszerének általánosítása . Az általánosított legkisebb négyzetek módszere a regressziós maradékok „általánosított négyzetösszegének” minimalizálására redukál - , ahol  a maradékok vektora,  egy szimmetrikus pozitív határozott súlyú mátrix. A szokásos legkisebb négyzetek módszere az általánosított speciális esete, amikor a súlymátrix arányos az azonossággal.

Megjegyzendő, hogy egy speciális esetet szoktak általánosított legkisebb négyzetek módszerének nevezni, amikor azt a mátrixot használjuk súlymátrixként, amely a modell véletlenszerű hibáinak kovarianciamátrixának inverze.

Az általánosított legkisebb négyzetek lényege

Ismeretes, hogy egy szimmetrikus pozitív határozott mátrix felbontható így , ahol P valamilyen nem degenerált négyzetmátrix. Ekkor az általánosított négyzetösszeg a transzformált (P felhasználásával) maradékok négyzetösszegeként ábrázolható . Lineáris regresszió esetén ez azt jelenti, hogy az érték minimalizálva van:

ahol , vagyis az általánosított legkisebb négyzetek lényege az adatok lineáris transzformációjára és a szokásos legkisebb négyzetek alkalmazására redukálódik ezekre az adatokra . Ha a véletlen hibák inverz kovarianciamátrixát (azaz ) használjuk súlymátrixként , a P transzformáció hatására a transzformált modell kielégíti a klasszikus (Gauss-Markov) feltevéseket, ezért a közönséges legkisebb négyzetek felhasználásával végzett paraméterbecslések lesznek a legjobbak. hatékony a lineáris torzítatlan becslések osztályában. És mivel az eredeti és a transzformált modell paraméterei megegyeznek, ez azt az állítást jelenti, hogy a GLSM becslések a leghatékonyabbak a lineáris torzítatlan becslések osztályában (Aitken tétele). Az általánosított legkisebb négyzetek képlete a következő:

Ezen becslések kovarianciamátrixa a következő:

Megfizethető GLS (FGLS, megvalósítható GLS)

Az általánosított legkisebb négyzetek használatának problémája az, hogy a véletlen hibák kovarianciamátrixa ismeretlen. Ezért a gyakorlatban a GLS egy elérhető változatát használják, amikor a V helyett valamilyen becslést használnak. Azonban ebben az esetben is felmerül egy probléma: a kovarianciamátrix független elemeinek száma , ahol a megfigyelések száma (például 100 megfigyelés esetén 5050 paramétert kell becsülni!). Ezért ez az opció nem teszi lehetővé a paraméterek minőségi becslését. A gyakorlatban további feltételezéseket tesznek a kovarianciamátrix szerkezetére vonatkozóan, vagyis feltételezzük, hogy a kovarianciamátrix elemei kevés számú ismeretlen paramétertől függenek . Számuk sokkal kevesebb legyen, mint a megfigyelések száma. Először a szokásos legkisebb négyzetek módszerét alkalmazzuk, megkapjuk a maradékokat, majd ezek alapján megbecsüljük a jelzett paramétereket . A kapott becslések felhasználásával megbecsüljük a hibakovariancia mátrixot, és alkalmazzuk az általánosított legkisebb négyzeteket ezzel a mátrixszal. Ez az akadálymentes GMS lényege. Bizonyított, hogy bizonyos meglehetősen általános feltételek mellett, ha a becslések konzisztensek, akkor az elérhető CLSM becslései is konzisztensek lesznek.

Súlyozott OLS

Ha a hibakovariancia mátrix átlós (van hiba heteroszkedaszticitás, de nincs autokorreláció), akkor az általánosított négyzetösszeg valójában egy súlyozott négyzetösszeg, ahol a súlyok fordítottan arányosak a hibavarianciákkal. Ebben az esetben súlyozott legkisebb négyzetekről (WLS, Weighted LS) beszélünk. A P transzformáció ebben az esetben abból áll, hogy az adatokat elosztjuk a véletlenszerű hibák szórásával. Az így súlyozott adatokra a szokásos legkisebb négyzetek módszerét alkalmazzuk.

Mint általában, a hibavarianciák ismeretlenek, és ugyanazokból az adatokból kell megbecsülni. Ezért a heteroszkedaszticitás szerkezetére vonatkozóan néhány egyszerűsítő feltevés fogalmazódik meg.

A hiba eltérése arányos valamely változó négyzetével

Ebben az esetben a tényleges átlós elemek ezzel a változóval arányos mennyiségek (jelöljük Z ) . Ráadásul az arányossági együtthatóra nincs szükség az értékeléshez. Valójában tehát ebben az esetben az eljárás a következő: osszuk el az összes változót Z -vel (beleértve az állandót is, vagyis egy új 1/Z változó jelenik meg ). Sőt, Z lehet magának az eredeti modellnek az egyik változója (ebben az esetben a transzformált modellnek lesz állandója). A normál legkisebb négyzetek módszerét alkalmazzuk a transzformált adatokra, hogy paraméterbecsléseket kapjunk:

Megfigyelések homogén csoportjai

Legyen n megfigyelés m homogén csoportra bontva, amelyeken belül ugyanazt a szórást feltételezzük. Ebben az esetben a modellt először a hagyományos legkisebb négyzetek segítségével értékeljük ki, és a maradékokat megtaláljuk. Az egyes csoportokon belüli maradékok esetében a csoport hibavarianciáit a maradékok négyzetösszegének és a csoportban végzett megfigyelések számának arányaként becsüljük meg. Továbbá minden j-edik megfigyelési csoport adatait elosztjuk és a szokásos LSM-et alkalmazzuk az így transzformált adatokra a paraméterek becsléséhez.

GLM autokorreláció esetén

Ha a véletlenszerű hibák engedelmeskednek az AR(1) modellnek , akkor az első megfigyelés figyelembe vétele nélkül a P transzformáció a következő lesz: az előző értékek szorozva a következővel: kivonásra kerülnek a változók aktuális értékéből :

Ezt a transzformációt autoregresszív transzformációnak nevezzük . Az első megfigyelésnél Price-Winsten korrekciót alkalmazunk  - az első megfigyelés adatait megszorozzuk -val . A transzformált modell véletlenszerű hibája , amelyet fehér zajnak feltételezünk. Ezért a hagyományos legkisebb négyzetek használata lehetővé teszi, hogy minőségi becsléseket kapjunk egy ilyen modellről.

Mivel az autoregressziós együttható ismeretlen, a rendelkezésre álló GLS különböző eljárásait alkalmazzuk.

A Cochrane-Orcutt eljárás

1. lépés: Értékelje ki az eredeti modellt a legkisebb négyzetek módszerével , és kapja meg a modell maradékait.

2. lépés: A modell maradékainak autokorrelációs együtthatójának becslése (formálisan az autoregressziós paraméter OLS-becsléseként is megkapható a maradékok segédregressziójában )

3. lépés: Az adatok autoregresszív transzformációja (a második lépésben becsült autokorrelációs együttható felhasználásával) és a transzformált modell paramétereinek becslése hagyományos legkisebb négyzetekkel.

A transzformált modell és paraméterbecslései az eredeti modell paraméterbecslései, kivéve az állandót, amelyet úgy állítunk vissza, hogy a transzformált modell állandóját elosztjuk 1-r -rel . Az eljárás a második lépéstől a kívánt pontosság eléréséig megismételhető.

Hildreth-Lou eljárás

Ebben az eljárásban közvetlen keresés történik az autokorrelációs együttható értékére, amely minimalizálja a transzformált modell maradékainak négyzetösszegét. Ugyanis r értékeit a lehetséges intervallumból (-1; 1) állítjuk be valamilyen lépéssel. Mindegyikre autoregresszív transzformációt hajtunk végre, a modellt a szokásos legkisebb négyzetekkel értékeljük, és megtaláljuk a maradékok négyzeteinek összegét. Olyan autokorrelációs együtthatót választunk, amelynél ez a négyzetösszeg minimális. Továbbá a talált pont közelében egy finomabb lépésű rácsot építünk, és az eljárást megismételjük.

Durbin eljárása

Az átalakított modell így néz ki:

A zárójeleket kibontva és a késéstől függő változót jobbra mozgatva azt kapjuk

Bemutatjuk a jelölést . Akkor a következő modellünk van

Ezt a modellt a szokásos legkisebb négyzetek módszerével kell becsülni. Ezután az eredeti modell együtthatói visszaállnak .

Ebben az esetben az autokorrelációs együttható kapott becslése felhasználható autoregresszív transzformációra, és a legkisebb négyzetek alkalmazása erre a transzformált modellre, hogy pontosabb paraméterbecsléseket kapjunk.

Lásd még

Irodalom