A Generalized Least Squares ( GLS , GLS ) egy módszer a regressziós modellek paramétereinek becslésére , amely a klasszikus legkisebb négyzetek módszerének általánosítása . Az általánosított legkisebb négyzetek módszere a regressziós maradékok „általánosított négyzetösszegének” minimalizálására redukál - , ahol a maradékok vektora, egy szimmetrikus pozitív határozott súlyú mátrix. A szokásos legkisebb négyzetek módszere az általánosított speciális esete, amikor a súlymátrix arányos az azonossággal.
Megjegyzendő, hogy egy speciális esetet szoktak általánosított legkisebb négyzetek módszerének nevezni, amikor azt a mátrixot használjuk súlymátrixként, amely a modell véletlenszerű hibáinak kovarianciamátrixának inverze.
Ismeretes, hogy egy szimmetrikus pozitív határozott mátrix felbontható így , ahol P valamilyen nem degenerált négyzetmátrix. Ekkor az általánosított négyzetösszeg a transzformált (P felhasználásával) maradékok négyzetösszegeként ábrázolható . Lineáris regresszió esetén ez azt jelenti, hogy az érték minimalizálva van:
ahol , vagyis az általánosított legkisebb négyzetek lényege az adatok lineáris transzformációjára és a szokásos legkisebb négyzetek alkalmazására redukálódik ezekre az adatokra . Ha a véletlen hibák inverz kovarianciamátrixát (azaz ) használjuk súlymátrixként , a P transzformáció hatására a transzformált modell kielégíti a klasszikus (Gauss-Markov) feltevéseket, ezért a közönséges legkisebb négyzetek felhasználásával végzett paraméterbecslések lesznek a legjobbak. hatékony a lineáris torzítatlan becslések osztályában. És mivel az eredeti és a transzformált modell paraméterei megegyeznek, ez azt az állítást jelenti, hogy a GLSM becslések a leghatékonyabbak a lineáris torzítatlan becslések osztályában (Aitken tétele). Az általánosított legkisebb négyzetek képlete a következő:
Ezen becslések kovarianciamátrixa a következő:
Az általánosított legkisebb négyzetek használatának problémája az, hogy a véletlen hibák kovarianciamátrixa ismeretlen. Ezért a gyakorlatban a GLS egy elérhető változatát használják, amikor a V helyett valamilyen becslést használnak. Azonban ebben az esetben is felmerül egy probléma: a kovarianciamátrix független elemeinek száma , ahol a megfigyelések száma (például 100 megfigyelés esetén 5050 paramétert kell becsülni!). Ezért ez az opció nem teszi lehetővé a paraméterek minőségi becslését. A gyakorlatban további feltételezéseket tesznek a kovarianciamátrix szerkezetére vonatkozóan, vagyis feltételezzük, hogy a kovarianciamátrix elemei kevés számú ismeretlen paramétertől függenek . Számuk sokkal kevesebb legyen, mint a megfigyelések száma. Először a szokásos legkisebb négyzetek módszerét alkalmazzuk, megkapjuk a maradékokat, majd ezek alapján megbecsüljük a jelzett paramétereket . A kapott becslések felhasználásával megbecsüljük a hibakovariancia mátrixot, és alkalmazzuk az általánosított legkisebb négyzeteket ezzel a mátrixszal. Ez az akadálymentes GMS lényege. Bizonyított, hogy bizonyos meglehetősen általános feltételek mellett, ha a becslések konzisztensek, akkor az elérhető CLSM becslései is konzisztensek lesznek.
Ha a hibakovariancia mátrix átlós (van hiba heteroszkedaszticitás, de nincs autokorreláció), akkor az általánosított négyzetösszeg valójában egy súlyozott négyzetösszeg, ahol a súlyok fordítottan arányosak a hibavarianciákkal. Ebben az esetben súlyozott legkisebb négyzetekről (WLS, Weighted LS) beszélünk. A P transzformáció ebben az esetben abból áll, hogy az adatokat elosztjuk a véletlenszerű hibák szórásával. Az így súlyozott adatokra a szokásos legkisebb négyzetek módszerét alkalmazzuk.
Mint általában, a hibavarianciák ismeretlenek, és ugyanazokból az adatokból kell megbecsülni. Ezért a heteroszkedaszticitás szerkezetére vonatkozóan néhány egyszerűsítő feltevés fogalmazódik meg.
Ebben az esetben a tényleges átlós elemek ezzel a változóval arányos mennyiségek (jelöljük Z ) . Ráadásul az arányossági együtthatóra nincs szükség az értékeléshez. Valójában tehát ebben az esetben az eljárás a következő: osszuk el az összes változót Z -vel (beleértve az állandót is, vagyis egy új 1/Z változó jelenik meg ). Sőt, Z lehet magának az eredeti modellnek az egyik változója (ebben az esetben a transzformált modellnek lesz állandója). A normál legkisebb négyzetek módszerét alkalmazzuk a transzformált adatokra, hogy paraméterbecsléseket kapjunk:
Legyen n megfigyelés m homogén csoportra bontva, amelyeken belül ugyanazt a szórást feltételezzük. Ebben az esetben a modellt először a hagyományos legkisebb négyzetek segítségével értékeljük ki, és a maradékokat megtaláljuk. Az egyes csoportokon belüli maradékok esetében a csoport hibavarianciáit a maradékok négyzetösszegének és a csoportban végzett megfigyelések számának arányaként becsüljük meg. Továbbá minden j-edik megfigyelési csoport adatait elosztjuk és a szokásos LSM-et alkalmazzuk az így transzformált adatokra a paraméterek becsléséhez.
Ha a véletlenszerű hibák engedelmeskednek az AR(1) modellnek , akkor az első megfigyelés figyelembe vétele nélkül a P transzformáció a következő lesz: az előző értékek szorozva a következővel: kivonásra kerülnek a változók aktuális értékéből :
Ezt a transzformációt autoregresszív transzformációnak nevezzük . Az első megfigyelésnél Price-Winsten korrekciót alkalmazunk - az első megfigyelés adatait megszorozzuk -val . A transzformált modell véletlenszerű hibája , amelyet fehér zajnak feltételezünk. Ezért a hagyományos legkisebb négyzetek használata lehetővé teszi, hogy minőségi becsléseket kapjunk egy ilyen modellről.
Mivel az autoregressziós együttható ismeretlen, a rendelkezésre álló GLS különböző eljárásait alkalmazzuk.
1. lépés: Értékelje ki az eredeti modellt a legkisebb négyzetek módszerével , és kapja meg a modell maradékait.
2. lépés: A modell maradékainak autokorrelációs együtthatójának becslése (formálisan az autoregressziós paraméter OLS-becsléseként is megkapható a maradékok segédregressziójában )
3. lépés: Az adatok autoregresszív transzformációja (a második lépésben becsült autokorrelációs együttható felhasználásával) és a transzformált modell paramétereinek becslése hagyományos legkisebb négyzetekkel.
A transzformált modell és paraméterbecslései az eredeti modell paraméterbecslései, kivéve az állandót, amelyet úgy állítunk vissza, hogy a transzformált modell állandóját elosztjuk 1-r -rel . Az eljárás a második lépéstől a kívánt pontosság eléréséig megismételhető.
Ebben az eljárásban közvetlen keresés történik az autokorrelációs együttható értékére, amely minimalizálja a transzformált modell maradékainak négyzetösszegét. Ugyanis r értékeit a lehetséges intervallumból (-1; 1) állítjuk be valamilyen lépéssel. Mindegyikre autoregresszív transzformációt hajtunk végre, a modellt a szokásos legkisebb négyzetekkel értékeljük, és megtaláljuk a maradékok négyzeteinek összegét. Olyan autokorrelációs együtthatót választunk, amelynél ez a négyzetösszeg minimális. Továbbá a talált pont közelében egy finomabb lépésű rácsot építünk, és az eljárást megismételjük.
Az átalakított modell így néz ki:
A zárójeleket kibontva és a késéstől függő változót jobbra mozgatva azt kapjuk
Bemutatjuk a jelölést . Akkor a következő modellünk van
Ezt a modellt a szokásos legkisebb négyzetek módszerével kell becsülni. Ezután az eredeti modell együtthatói visszaállnak .
Ebben az esetben az autokorrelációs együttható kapott becslése felhasználható autoregresszív transzformációra, és a legkisebb négyzetek alkalmazása erre a transzformált modellre, hogy pontosabb paraméterbecsléseket kapjunk.
Legkisebb négyzetek és regressziós elemzés | |||||||||
---|---|---|---|---|---|---|---|---|---|
Számítási statisztika |
| ||||||||
Összefüggés és függőség |
| ||||||||
Regresszió analízis |
| ||||||||
A regresszió mint statisztikai modell |
| ||||||||
Variancia dekompozíció |
| ||||||||
Modell tanulmány |
| ||||||||
Előfeltételek |
| ||||||||
Kísérleti tervezés |
| ||||||||
Numerikus közelítés | |||||||||
Alkalmazások |
|