Nemlineáris regresszió

A nemlineáris regresszió a regressziós elemzés  egy olyan fajtája, amelyben a kísérleti adatokat egy függvény modellezi, amely modellparaméterek nemlineáris kombinációja, és egy vagy több független változótól függ. Az adatokat az egymást követő közelítések módszerével közelítjük .

Általános rendelkezések

Az adatok az x hibamentes magyarázó változókból és a kapcsolódó megfigyelt függő változókból ( válaszokból ) y állnak . Minden y változó egy valószínűségi változóként van modellezve, amelynek átlagát egy f ( x ,β) nemlineáris függvény adja meg . Módszertani hiba előfordulhat, de feldolgozása túlmutat a regresszióanalízis határain. Ha a magyarázó változók nem mentesek a hibáktól, akkor a modellből olyan modell lesz, amelyben a változók hibásak, és szintén nem érvényesül.

Például az enzimatikus kinetika Michaelis-Menten modellje

úgy írható fel

ahol  a paraméter ,  a paraméter , és [ S ] a független változó ( x ). Ez a függvény nemlineáris, mert nem fejezhető ki és lineáris kombinációjaként .

A nemlineáris függvények további példái az exponenciális függvények , a logaritmikus függvények , a trigonometrikus függvények , a hatványfüggvények , a Gauss-függvények és a Lorentz-görbék . A regressziós analízis olyan függvényekkel, mint az exponenciális vagy a log, néha lineáris esetre redukálható, és standard lineáris regresszió is alkalmazható, de óvatosan kell használni. A részletekért lásd az alábbi Linearizálás részt.

Általános esetben előfordulhat, hogy zárt formájú reprezentáció (mint a lineáris regresszió esetében ) nem létezik. Általában optimalizáló algoritmusokat használnak a legjobb paraméterbecslések meghatározására . A lineáris regressziótól eltérően az optimalizált függvénynek több lokális minimuma is lehet , és a globális minimum akár torzított becslést is adhat. A gyakorlatban a paraméterek becsült értékeit egy optimalizáló algoritmussal együtt használják, hogy megkíséreljék megtalálni a négyzetösszeg globális minimumát.

A nemlineáris modellezéssel kapcsolatos részletekért lásd a " Legkisebb négyzetek " és a " Nemlineáris legkisebb négyzetek részt .

Regressziós statisztikák

Az eljárás alapjául szolgáló feltételezés az, hogy a modell egy lineáris függvénnyel közelíthető.

ahol . Ez abból következik, hogy a legkisebb négyzetek becslését a képlet adja meg

A nemlineáris regressziós statisztikát számítjuk ki és használjuk lineáris regressziós statisztikaként, de a képletekben X helyett J -t használunk . A lineáris illesztés torzítást okoz a statisztikákban, ezért óvatosabbnak kell lenni a nemlineáris modellből származó statisztikák értelmezésekor.

Közönséges és súlyozott legkisebb négyzetek

Gyakran azt feltételezik, hogy a legjobban illeszkedő görbe az, amely minimalizálja a négyzetes maradékok összegét . Ez a (hagyományos) legkisebb négyzetek (OLS) megközelítése. Abban az esetben azonban, ha a függő változó nem állandó szórással rendelkezik, a súlyozott négyzetek összege minimalizálható . Ideális esetben minden súlynak a megfigyelések szórásának reciproka kell lennie, azonban a súlyok minden iterációnál újraszámíthatók egy iteratív súlyozott legkisebb négyzetek algoritmusával.

Linearizálás

Átalakulás

Néhány nemlineáris regressziós probléma lineárissá redukálható a modell megfogalmazásának megfelelő átalakításával.

Vegyük például a nemlineáris regressziós problémát

a és b paraméterekkel és U multiplikatív hibatényezővel . Ha mindkét oldal logaritmusát vesszük, azt kapjuk

ahol u = ln( U ). Ebből az ln( y ) x -en lineáris regressziójával becslést kaphatunk az ismeretlen paraméterekre, és a számítások nem igényelnek iteratív optimalizálást. A nemlineáris transzformáció használata azonban körültekintést igényel. Megváltozik az adatértékek hatása, megváltozik a modellhibák mintázata és a kapott eredmények értelmezése, ami nemkívánatos eredményekhez vezethet. Másrészt a nemlineáris transzformáció a legnagyobb hibaforrástól függően Gauss-eloszlásként oszthatja el a hibákat, ezért a modellt figyelembe kell venni a nemlineáris transzformáció alkalmazásakor.

Például a Michaelis-Menten egyenlethez a Lineweaver-Burk lineáris reprezentációt széles körben használják

.

Az adathibákra való nagy érzékenysége, valamint az erős torzítás miatt azonban ez nem ajánlott.

Az exponenciális eloszlások családjába tartozó hibaeloszlások esetén a paraméterek általánosított lineáris modellé alakíthatók egy linkfüggvénnyel .

Szegmentálás

A független változó (mondjuk X) felosztható osztályokra vagy szegmensekre, és szegmensenkénti lineáris regresszió hajtható végre. A konfidenciaanalízissel végzett szegmentált regresszióolyan eredményt hozhat, amelyben a függő változó vagy válasz (mondjuk Y) eltérően viselkedik a különböző szegmensekben [1] .

A jobb oldali grafikon azt mutatja, hogy a talaj sótartalma (X) kezdetben nincs hatással a mustár hozamára (Y), amíg el nem érik a kritikus vagy küszöbértéket , ami után negatív hatással van a termésre [2]

Példák

A Titius-Bode-szabály matematikai képlet formájában egy egydimenziós , nemlineáris regressziós egyenlet , amely a Naprendszer bolygóinak a Naptól számított sorszámát a fő félig közelítő értékeivel hozza összefüggésbe. -pályáik tengelyei . _ A pontosság elég kielégítő, nem csillagászati ​​célokra.

Lásd még

Jegyzetek

  1. Oosterbaan, 1994 , p. 175-224.
  2. ( Oosterbaan 2002 ) Az illusztrációt készítette: SegReg

Irodalom

Olvasás további olvasáshoz