A nemlineáris regresszió a regressziós elemzés egy olyan fajtája, amelyben a kísérleti adatokat egy függvény modellezi, amely modellparaméterek nemlineáris kombinációja, és egy vagy több független változótól függ. Az adatokat az egymást követő közelítések módszerével közelítjük .
Az adatok az x hibamentes magyarázó változókból és a kapcsolódó megfigyelt függő változókból ( válaszokból ) y állnak . Minden y változó egy valószínűségi változóként van modellezve, amelynek átlagát egy f ( x ,β) nemlineáris függvény adja meg . Módszertani hiba előfordulhat, de feldolgozása túlmutat a regresszióanalízis határain. Ha a magyarázó változók nem mentesek a hibáktól, akkor a modellből olyan modell lesz, amelyben a változók hibásak, és szintén nem érvényesül.
Például az enzimatikus kinetika Michaelis-Menten modellje
úgy írható fel
ahol a paraméter , a paraméter , és [ S ] a független változó ( x ). Ez a függvény nemlineáris, mert nem fejezhető ki és lineáris kombinációjaként .
A nemlineáris függvények további példái az exponenciális függvények , a logaritmikus függvények , a trigonometrikus függvények , a hatványfüggvények , a Gauss-függvények és a Lorentz-görbék . A regressziós analízis olyan függvényekkel, mint az exponenciális vagy a log, néha lineáris esetre redukálható, és standard lineáris regresszió is alkalmazható, de óvatosan kell használni. A részletekért lásd az alábbi Linearizálás részt.
Általános esetben előfordulhat, hogy zárt formájú reprezentáció (mint a lineáris regresszió esetében ) nem létezik. Általában optimalizáló algoritmusokat használnak a legjobb paraméterbecslések meghatározására . A lineáris regressziótól eltérően az optimalizált függvénynek több lokális minimuma is lehet , és a globális minimum akár torzított becslést is adhat. A gyakorlatban a paraméterek becsült értékeit egy optimalizáló algoritmussal együtt használják, hogy megkíséreljék megtalálni a négyzetösszeg globális minimumát.
A nemlineáris modellezéssel kapcsolatos részletekért lásd a " Legkisebb négyzetek " és a " Nemlineáris legkisebb négyzetek részt .
Az eljárás alapjául szolgáló feltételezés az, hogy a modell egy lineáris függvénnyel közelíthető.
ahol . Ez abból következik, hogy a legkisebb négyzetek becslését a képlet adja meg
A nemlineáris regressziós statisztikát számítjuk ki és használjuk lineáris regressziós statisztikaként, de a képletekben X helyett J -t használunk . A lineáris illesztés torzítást okoz a statisztikákban, ezért óvatosabbnak kell lenni a nemlineáris modellből származó statisztikák értelmezésekor.
Gyakran azt feltételezik, hogy a legjobban illeszkedő görbe az, amely minimalizálja a négyzetes maradékok összegét . Ez a (hagyományos) legkisebb négyzetek (OLS) megközelítése. Abban az esetben azonban, ha a függő változó nem állandó szórással rendelkezik, a súlyozott négyzetek összege minimalizálható . Ideális esetben minden súlynak a megfigyelések szórásának reciproka kell lennie, azonban a súlyok minden iterációnál újraszámíthatók egy iteratív súlyozott legkisebb négyzetek algoritmusával.
Néhány nemlineáris regressziós probléma lineárissá redukálható a modell megfogalmazásának megfelelő átalakításával.
Vegyük például a nemlineáris regressziós problémát
a és b paraméterekkel és U multiplikatív hibatényezővel . Ha mindkét oldal logaritmusát vesszük, azt kapjuk
ahol u = ln( U ). Ebből az ln( y ) x -en lineáris regressziójával becslést kaphatunk az ismeretlen paraméterekre, és a számítások nem igényelnek iteratív optimalizálást. A nemlineáris transzformáció használata azonban körültekintést igényel. Megváltozik az adatértékek hatása, megváltozik a modellhibák mintázata és a kapott eredmények értelmezése, ami nemkívánatos eredményekhez vezethet. Másrészt a nemlineáris transzformáció a legnagyobb hibaforrástól függően Gauss-eloszlásként oszthatja el a hibákat, ezért a modellt figyelembe kell venni a nemlineáris transzformáció alkalmazásakor.
Például a Michaelis-Menten egyenlethez a Lineweaver-Burk lineáris reprezentációt széles körben használják
.Az adathibákra való nagy érzékenysége, valamint az erős torzítás miatt azonban ez nem ajánlott.
Az exponenciális eloszlások családjába tartozó hibaeloszlások esetén a paraméterek általánosított lineáris modellé alakíthatók egy linkfüggvénnyel .
A független változó (mondjuk X) felosztható osztályokra vagy szegmensekre, és szegmensenkénti lineáris regresszió hajtható végre. A konfidenciaanalízissel végzett szegmentált regresszióolyan eredményt hozhat, amelyben a függő változó vagy válasz (mondjuk Y) eltérően viselkedik a különböző szegmensekben [1] .
A jobb oldali grafikon azt mutatja, hogy a talaj sótartalma (X) kezdetben nincs hatással a mustár hozamára (Y), amíg el nem érik a kritikus vagy küszöbértéket , ami után negatív hatással van a termésre [2]
A Titius-Bode-szabály matematikai képlet formájában egy egydimenziós , nemlineáris regressziós egyenlet , amely a Naprendszer bolygóinak a Naptól számított sorszámát a fő félig közelítő értékeivel hozza összefüggésbe. -pályáik tengelyei . _ A pontosság elég kielégítő, nem csillagászati célokra.
Legkisebb négyzetek és regressziós elemzés | |||||||||
---|---|---|---|---|---|---|---|---|---|
Számítási statisztika |
| ||||||||
Összefüggés és függőség |
| ||||||||
Regresszió analízis |
| ||||||||
A regresszió mint statisztikai modell |
| ||||||||
Variancia dekompozíció |
| ||||||||
Modell tanulmány |
| ||||||||
Előfeltételek |
| ||||||||
Kísérleti tervezés |
| ||||||||
Numerikus közelítés | |||||||||
Alkalmazások |
|