Boltzmann gép

A Boltzmann gép egyfajta  sztochasztikus visszatérő neurális hálózat , amelyet Jeffrey Hinton és Terry Sejnowski talált fel 1985-ben [1] . A Boltzmann gép a Hopfield hálózat sztochasztikus generatív változatának tekinthető .

A statisztikusok az ilyen hálózatokat véletlenszerű Markov mezőknek nevezik . A hálózatot Boltzmann gépnek nevezték el Ludwig Boltzmann osztrák fizikusról, a statisztikai fizika egyik megalapítójáról .

Ez a hálózat annealing szimulációs algoritmust használ a tanuláshoz , és az első olyan neurális hálózatnak bizonyult, amely képes belső reprezentációkat tanulni és összetett kombinatorikus problémákat megoldani. Ennek ellenére számos probléma miatt a korlátlan csatlakozási képességű Boltzmann gépek gyakorlati problémák megoldására nem használhatók. Ha a kapcsolat korlátozott, akkor a képzés elég hatékony lehet ahhoz, hogy a gyakorlatban is használható legyen. Konkrétan az úgynevezett mély bizalomháló a korlátozott Boltzmann-gépek kaszkádjából épül fel .

Modell

A Hopfield-hálózathoz hasonlóan a Boltzmann-gép is neuronok hálózata, amelyhez az "energia" fogalmát definiálják. A globális energia számítása a Hopfield-hálózathoz hasonló formában történik: [2]

Ahol:

A linkekre a következő korlátozások vonatkoznak:

Termikus egyensúly

A Hopfield hálózat egyik fő hátránya az a tendencia, hogy a hálózat állapotát lokális, nem pedig globális minimumon "stabilizálja". A gyakorlatban kívánatos, hogy a hálózat gyakrabban térjen át mélyenergia-minimumokra, mint a sekélyekre, és hogy a hálózat relatív valószínűsége két különböző energiájú minimum valamelyikére váltson át csak azok mélységének arányától függjön. Ez lehetővé tenné az adott kimeneti állapotvektorok megszerzésének valószínűségét a rendszer energiafelületének profiljának megváltoztatásával a kötéssúlyok módosításával. Ezen megfontolások alapján készült el a Boltzmann gép.

S. Kirpatrické az az ötlete, hogy a "termikus zajt" használják a helyi minimumokból való kilépésre és a mélyebb minimumok elérésének valószínűségének növelésére. Ezen ötlet alapján egy lágyítási szimulációs algoritmust fejlesztettek ki .

Vezessünk be néhány paramétert  – a termikus zajszint analógját. Ezután a Boltzmann valószínűségi függvény alapján meghatározzuk egy bizonyos neuron aktivitásának valószínűségét:

hol  van a hőzaj szintje a hálózatban; a th neuron és az összes jelenleg aktív neuron  közötti kapcsolatok súlyának összege .

Korlátozott Boltzmann gép

Bár a gyakorlatban a Boltzmann-gép betanítási képességei korlátozottak, ezek a problémák megoldhatók a korlátozott Boltzmann-gép (RBM) architektúra alkalmazásával. Ebben az architektúrában csak a rejtett és látható neuronok között léteznek kapcsolatok, de az azonos osztályba tartozó neuronok között nincs kapcsolat. Egy ilyen architektúrát eredetileg Paul Smolensky használt 1986-ban Harmonium néven [3] , de csak azután vált népszerűvé, hogy Hinton a 2000-es évek közepén feltalálta a gyors tanuló algoritmusokat.

A korlátozott Boltzmann gépeket mély tanulási hálózatokban használják . A mély hithálózatok különösen az RBM „átfedésével”, majd a backpropagation algoritmussal történő újraképzéssel érhetők el.

Jegyzetek

  1. Ackley, David H.; Hinton, Geoffrey E.; Sejnowski, Terrence J. Tanulási algoritmus Boltzmann gépekhez. - Kognitív Tudomány 9 (1), 1985. - S. 147-169.
  2. Loskutov A. Yu. , Mikhailov A. S. Bevezetés a szinergetikába. - M., Nauka, 1990. - ISBN 5-02-014475-4 . - Val vel. 233-237
  3. Szmolenszkij, Paul. 6. fejezet: Információfeldolgozás dinamikus rendszerekben: A harmóniaelmélet alapjai // Párhuzamos elosztott feldolgozás: Explorations in the Microstructure of Cognition, 1. kötet: Alapok  (angol) / Rumelhart, David E.; McLelland, James L. - MIT Press , 1986. - P. 194-281. — ISBN 0-262-68053-X . Archivált másolat (nem elérhető link) . Letöltve: 2014. június 12. Az eredetiből archiválva : 2013. június 13.. 

Linkek