Koordináta süllyedés

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. április 16-án felülvizsgált verziótól ; az ellenőrzéshez 1 szerkesztés szükséges .

A koordináta süllyedés egy olyan optimalizáló algoritmus , amely szekvenciálisan minimalizálja a függvényt koordinátairányok mentén. Az algoritmus minden iterációnál meghatároz egy koordinátaváltozót vagy koordinátablokkot egy koordinátakiválasztási szabály segítségével, majd pontosan vagy megközelítőleg minimalizálja a megfelelő koordináta-hipersíkot, miközben más koordinátákat vagy koordinátablokkokat rögzít. Az aktuális iterációnál a koordinátairány mentén lineáris keresés végezhető a megfelelő lépésméret megtalálásához. A koordináta leszármazás alkalmazható differenciálható esetben és olyan kontextus esetén is, amikor a származékokat nem számítják ki.

Leírás

A koordináta süllyedés azon az elgondoláson alapul, hogy sok változó függvényének minimalizálása történhet úgy, hogy egyszerre csak egy irányban minimalizáljuk, például egyetlen változó optimalizálási feladatot (vagy legalábbis egy egyszerűbb feladatot) megoldunk egy hurokban [1] . A ciklikus koordináta süllyedés legegyszerűbb esetben az algoritmus iterációnként egyet hajt végre a koordináta irányain, és egyszerre minimalizálja a célfüggvényt minden koordinátán. Vagyis a kezdeti értékekből kiindulva $F(\mathbf {x} )$

\mathbf {x} ^{0}=(x_{1}^{0},\ldots ,x_{n}^{0})

iteráció határozza meg az optimalizálási problémák iteratív megoldásával egy változóból $k+1$ $\mathbf {x} ^{k+1}$ ${\displaystyle \mathbf {x} ^{k))$

x_{i}^{k+1}={\underset {y\in \mathbb {R} }{\operatorname {arg\,min} }}\;f(x_{1}^{k+ 1 },\pontok ,x_{i-1}^{k+1},y,x_{i+1}^{k},\pontok ,x_{n}^{k})

[2]

minden vektorváltozóhoz 1 - től . $x_{i}$ $\mathbf {x}$ $én$ $n$

Így az algoritmus a függvény lokális minimumának kezdeti közelítésével indul, és iteratív módon kap egy vektorsorozatot . $\mathbf {x} ^{0}$ $F$ $\mathbf {x} ^{0},\mathbf {x} ^{1},\mathbf {x} ^{2},\dots$

Ha minden iterációnál lineáris keresést végzünk , azt kapjuk

F(\mathbf {x} ^{0})\geqslant F(\mathbf {x} ^{1})\geqslant F(\mathbf {x} ^{2})\geqslant \dots .

Kimutatható, hogy ennek a sorozatnak a legmeredekebb ereszkedési módszeréhez hasonló konvergenciatulajdonságai vannak. A célfüggvény javulásának hiánya a következő lineáris keresési ciklus után a koordináta irányok mentén azt jelzi, hogy egy stacionárius pontot értünk el.

Az algoritmus működését az alábbiakban mutatjuk be.

Differenciálható eset

Az F függvény folytonos differenciálhatósága esetén a koordináta süllyedési algoritmus a következőképpen foglalható össze : [1] :

Kiválasztjuk az x kezdővektort .
Amíg el nem érik a konvergencia szintjét vagy meghatározott számú iterációt nem hajtanak végre:
- Válasszon egy i indexet az 1 és n közötti intervallumból .
- α lépésméretet választunk .
- -ra cseréljük . $x_{i}$ $x_{i}-\alpha {\tfrac {\partial F}{\partial x_{i))}(\mathbf {x} )$

A lépést sokféleképpen meg lehet választani, például egy minimalizálási feladat megoldásával (vagyis az F kivételével fix változókkal minimalizálva ), vagy hagyományos lineáris kereséssel [1] . $f(x_{i})=F(\mathbf {x} )$ $x_{i}$

Korlátozások

A koordináta süllyedésnek két problémája van. Az egyik a több változó nem sima függvényének jelenléte. Az ábrán látható, hogy a koordináta süllyedési iterációk nem stacionárius pontba futhatnak, ha a függvény szintgörbéi nem simák. Tegyük fel, hogy az algoritmus a (-2, -2) pontban kötött ki . Ezután a tengelyekkel párhuzamos két irány van, amelyek mentén meg kell tenni a következő lépést. Piros nyilakkal vannak ábrázolva. E két irányban minden lépés azonban a függvény értékének növekedéséhez vezet (feltételezzük, hogy a minimalizálási probléma megoldódik), így az algoritmus egyetlen lépést sem tesz meg, bár két lépés együttesen a algoritmus közelebb kerül az optimumhoz. Bár ez a példa azt mutatja, hogy a koordináta süllyedés nem feltétlenül vezet optimális megoldáshoz, normális körülmények között lehetséges formális konvergencia kimutatása [3] .

Egy másik probléma a párhuzamosítás nehézsége. Mivel a koordináta-süllyedés természete az irányok közötti hurok, és minden koordinátairány mentén minimalizálja a függvényt, a koordináta-süllyedés nem nyilvánvaló jelölt párhuzamosításra. A legújabb kutatások kimutatták, hogy a párhuzamosítás néhány speciális trükkel használható koordináta-leszálláshoz [4] [5] [6] .

Alkalmazások

A koordináta ereszkedési algoritmusok egyszerűségük miatt népszerűek, de ugyanez a tulajdonság arra ösztönzi a kutatókat, hogy figyelmen kívül hagyják őket az érdekesebb (összetettebb) módszerek javára [1] . A koordináta süllyedés optimalizálás korai alkalmazásai a számítógépes tomográfia területén voltak [7] , ahol a módszer gyors konvergenciát mutatott [8] , és többrétegű helikális komputertomográfiai képek rekonstruálására használták [9] . A ciklikus koordináta süllyedés algoritmusát a fehérjeszerkezet előrejelzésében alkalmazták [10] . Ezen túlmenően, a gépi tanulás nagyszabású problémáinak megjelenésével egyre nőtt az érdeklődés a koordináta süllyedésének alkalmazása iránt , ahol a koordináta-leszállás versenyképesnek bizonyult más módszerekkel szemben, ha olyan problémákra alkalmazzák, mint például a lineáris támogató vektor gépi tanulás . 11] (lásd LIBLINEAR ) és nemnegatív mátrixbővítés [12] . A módszerek vonzóak olyan problémák esetén, ahol a gradiens számítás nem kivitelezhető, talán azért, mert a szükséges adatok számítógépes hálózatokon vannak elosztva [13] .

Lásd még

Jegyzetek

↑ 1 2 3 4 Wright, 2015 , p. 3–34.
↑ Archivált másolat . Letöltve: 2022. február 6. Az eredetiből archiválva : 2022. február 6.. (határozatlan)
↑ Spall, 2012 , p. 187–208.
↑ Zheng, Saquib, Sauer, Bouman, 2000 , p. 1745–1759
↑ Fessler, Ficaro, Clinthorne, Lange, 1997 , p. 166–175.
↑ Wang, Sabne, Kisner, 2016 , p. 2:1–2:12.
↑ Sauer, Bouman, 1993 , p. 534–548.
↑ Yu, Thibault, Bouman, Sauer, 2011 , p. 161–175.
↑ Thibault, Sauer, Bouman, Hsieh, 2007 , p. 4526–4544.
↑ Canutescu, Dunbrack, 2003 , p. 963–72.
↑ Hsieh, Chang, Lin, Keerthi, 2008 , p. 408.
↑ Hsieh, Dhillon, 2011 , p. 1064.
↑ Neszterov, 2012 , p. 341–362.

Irodalom

Stephen J. Wright. Koordináta süllyedési algoritmusok // Matematikai programozás. - 2015. - T. 151 , sz. 1 . - doi : 10.1007/s10107-015-0892-3 . - arXiv : 1502.04759 .
Spall JC ciklikus libikókafolyamat optimalizáláshoz és azonosításhoz // Journal of Optimization Theory and Applications. - 2012. - T. 154 , sz. 1 . - doi : 10.1007/s10957-012-0001-1 .
Zheng J., Saquib SS, Sauer K., Bouman CA Párhuzamos Bayes-féle tomográfiai algoritmusok gyors, garantált konvergenciával // IEEE Transactions on Image Processing. - 2000. - T. 9 , sz. 10 . — ISSN 1057-7149 . - doi : 10.1109/83.869186 . - Iránykód . — PMID 18262913 .
Fessler JA, Ficaro EP, Clinthorne NH, Lange K. Grouped-coordinate ascent algorithms for penalized-likelihood transfer image rekonstruction // IEEE Transactions on Medical Imaging. - 1997. - T. 16 , sz. 2 . — ISSN 0278-0062 . - doi : 10.1109/42.563662 . — PMID 9101326 .
Xiao Wang, Amit Sabne, Sherman Kisner, Anand Raghunathan, Charles Bouman, Samuel Midkiff. Nagy teljesítményű modell alapú képrekonstrukció . — A 21. ACM SIGPLAN Szimpózium a Párhuzamos programozás alapelvei és gyakorlata témakörében. — New York, NY, USA: ACM, 2016. — ISBN 9781450340922 . - doi : 10.1145/2851141.2851163 .
Ken Sauer, Charles Bowman. Helyi frissítési stratégia az előrejelzésekből származó iteratív rekonstrukcióhoz // IEEE Transactions on Signal Processing. - 1993. - február ( 41. évf. , 2. szám ). - doi : 10.1109/78.193196 . - Iránykód .
Zhou Yu, Jean-Baptiste Thibault, Charles Bouman, Ken Sauer, Jiang Hsieh. Gyors, modellalapú röntgen-CT-rekonstrukció térbeli nem homogén ICD-optimalizálással // IEEE-tranzakciók a képfeldolgozáson. - 2011. - január ( 20. évf. , 1. szám ). - doi : 10.1109/TIP.2010.2058811 . - Iránykód . — PMID 20643609 .
Jean-Baptiste Thibault, Ken Sauer, Charles Bouman, Jiang Hsieh. Háromdimenziós statisztikai megközelítés a többszeletű helikális CT jobb képminőségéhez // Orvosi fizika. - 2007. - november ( 34. évf. , 11. szám ). - doi : 10,1118/1,2789499 . - . — PMID 18072519 .
Canutescu AA, Dunbrack RL Ciklikus koordináta süllyedés: robotikai algoritmus fehérjehurok lezárására. // Protein Science. - 2003. - T. 12 , sz. 5 . - doi : 10.1110/ps.0242703 . — PMID 12717019 .
Hsieh CJ, Chang KW, Lin CJ, Keerthi SS, Sundararajan S. A dual koordináta süllyedés módszere nagyméretű lineáris SVM-hez // Proceedings of the 25th international Conference on Machine learning - ICML '08. - 2008. - ISBN 9781605582054 . - doi : 10.1145/1390156.1390208 .
Hsieh CJ, Dhillon IS Gyors koordináta süllyedési módszerek változó kiválasztásával nem-negatív mátrixfaktorizáláshoz // Proceedings of the 17th ACM SIGKDD International Conference on Knowledge discovery and data mining - KDD '11 . - 2011. - ISBN 9781450308137 . - doi : 10.1145/2020408.2020577 .
Jurij Neszterov. Koordináta süllyedési módszerek hatékonysága óriási léptékű optimalizálási problémákon // SIAM J. Optim.. - 2012. - V. 22 , no. 2 . - doi : 10.1137/100802001 .
Bezdek JC, Hathaway RJ, Howard RE, Wilson CA, Windham MP Helyi konvergenciaelemzés a koordináta-deszcencia csoportosított változóváltozatának helyi konvergenciaanalízise // Journal of Optimization Theory and Applications. - Kluwer Academic / Plenum Publishers, 1987. - V. 54 , no. 3 . - P. 471-477. - doi : 10.1007/BF00940196 .
Dimitri P. Bertsekas,. nemlineáris programozás. - Második kiadás. - Belmont, Massachusetts: Athena Scientific, 1999. - ISBN 1-886529-00-0 .
Zhiquan Luo, Tseng P. A konvex differenciálható minimalizálás koordináta-descent módszerének konvergenciájáról // Journal of Optimization Theory and Applications. - Kluwer Academic / Plenum Publishers, 1992. - T. 72 , no. 1 . — P. 7–35. - doi : 10.1007/BF00939948 . .
Tong Tong Wu, Kenneth Lange. Coordinate decent algoritms for Lasso penalized regression // The Annals of Applied Statistics. - Matematikai Statisztikai Intézet, 2008. - 2. évf. , no. 1 . - P. 224-244. - doi : 10.1214/07-AOAS147 . - arXiv : 0803.3876 . .
Peter Richtarik, Martin Takac. Véletlenszerű blokk-koordináta süllyedési módszerek iterációs összetettsége összetett függvény minimalizálására // Matematikai programozás. - Springer, 2011. április. - 144. évf. , no. 1–2 . — P. 1–38. - doi : 10.1007/s10107-012-0614-z . - arXiv : 1107.2848 .
Peter Richtarik, Martin Takac. Párhuzamos koordináta süllyedési módszerek a nagy adatok optimalizálásához // ArXiv:1212.0873. - 2012. december - arXiv : 1212.0873 .

Optimalizálási módszerek
Egydimenziós	aranymetszet módszer Kettősség Parabola módszer Rács keresés Egységes blokkkeresési módszer Fibonacci módszer Háromszoros keresés Piyavsky módszer Strongin módszer
Nulla sorrend	Gauss módszer Nelder-Mead módszer Hook-Jeeves módszer Rosenbrock módszer Powell-módszer
Első rendelés	gradiens süllyedés Zeutendijk módszer Koordináta süllyedés Konjugált gradiens módszer Kvázi-Newtoni módszerek Levenberg-Marquardt algoritmus
másodrendű	Newton módszere Newton-Raphson módszer Broyden-Fletcher-Goldfarb-Shanno algoritmus (BFGS)
Sztochasztikus	Monte Carlo módszer Szimulált lágyítás Evolúciós algoritmusok differenciális evolúció Hangya algoritmus Részecskeraj módszer Méhtelep algoritmus Véletlenszerű séta módszer
Lineáris programozási módszerek	Simplex módszer Gomori algoritmusa Ellipszoid módszer Potenciális módszer
Nemlineáris programozási módszerek	Szekvenciális kvadratikus programozás