Szoftver tranzakciós memória

A számítástechnikában a szoftvertranzakciós memória ( STM ) egy párhuzamos számítási folyamat során a megosztott memóriához való hozzáférés szabályozására szolgáló adatbázis - tranzakciós mechanizmushoz hasonló párhuzamosság-vezérlő mechanizmus . Ez egy alternatíva a zár alapú szinkronizáláshoz . A tranzakció ebben az összefüggésben egy olyan kódrészlet, amely a megosztott (megosztott) memóriából olvas és oda ír. Az olvasás és írás logikailag egyetlen időpontban történik, és a köztes állapotok láthatatlanok a többi (eredményes) tranzakció számára. A tranzakciók hardveres támogatással történő biztosításának ötlete 1986-ban Tom Knight munkájából és szabadalmából származik . [1] Az ötletet Maurice Herlihy és Eliot Moss tette közzé . [2] 1995-ben Nir Shavit és Dan Toytu kiterjesztette ezt az ötletet a szoftveres tranzakciós memóriára (STM). Az STM még mindig az intenzív kutatások középpontjában áll; a gyakorlati megvalósítások támogatottsága növekszik.

Jellemzők

A legtöbb modern többszálú alkalmazásban használt blokkoló módszerekkel ellentétben az STM nagyon optimista: a szálak a megosztott memóriában végrehajtott változtatásokat anélkül hajtják végre, hogy a többi szál mit csinálnak, és minden olvasást és írást naplóz a naplóba. Ahelyett, hogy az írót használnák annak ellenőrzésére, hogy ez negatív hatással van-e más folyamatban lévő műveletekre, a felelősség az olvasóra száll át, amely a teljes tranzakció befejezése után ellenőrzi, hogy más szálak egyidejűleg módosítottak-e a memóriában, amelyhez a programban hozzáfértek. múlt. Ezt az utolsó műveletet, amely ellenőrzi a tranzakciós változásokat, és ha az ellenőrzés sikeres, változatlan marad, véglegesítésnek nevezzük. A tranzakció bármikor felmondható, melynek eredményeként az összes legutóbbi módosítás törlésre kerül. Ha egy tranzakciót nem lehet végrehajtani változási ütközések miatt, akkor megszakad, és az elejétől újra próbálkozik a sikeres befejezésig.

Ennek az optimista megközelítésnek az előnyét a párhuzamosság növeli: egyetlen szálnak sem kell megvárnia az erőforráshoz való hozzáférést, és a különböző szálak egyidejűleg és biztonságosan módosíthatják az adatstruktúra olyan diszjunkt részeit, amelyeket ugyanaz a zár védene.

A gyakorlatban azonban az STM-rendszerek teljesítményüket veszítik a kis számú (alkalmazástól függően 1-től 4-ig terjedő) processzoron alapuló, finomszemcsés rendszerekhez képest. Ennek oka elsősorban a naplóvezetés többletköltsége és a tranzakciókra fordított idő. De még ebben az esetben is a teljesítmény legfeljebb 2-szer tér el. [3] Az STM támogatói úgy vélik, hogy az ilyen veszteségeket az STM koncepcionális előnyei indokolják.

Elméletileg n párhuzamos tranzakció futtatásának időbeli és térbeli összetettsége a legrosszabb esetben O (n) . A tényleges költség a megvalósítástól függ (a többletköltség elkerülése érdekében a tranzakciót korán törölheti), de mindig lesznek olyan esetek, bár ritkák, amikor a zárolási algoritmusok időben bonyolultabbak, mint a szoftveres tranzakciós memória.

Koncepcionális előnyök és hátrányok

A teljesítménybeli előnyök mellett az STM nagyban leegyszerűsíti a többszálú programok fogalmi megértését, és segíti karbantarthatóságukat azáltal, hogy zökkenőmentesen dolgozik a meglévő magas szintű absztrakciókkal, például objektumokkal és modulokkal.

A zárprogramozás számos ismert problémát tartalmaz, amelyek gyakran előfordulnak a gyakorlatban:

Fontos, hogy tisztában legyünk az átfedő műveletekkel és a részműveletekkel a kód különálló és látszólag független részeiben – ez nagyon nehéz és hibás feladat.
A programozóknak meg kell tanulniuk a zárolási szabályokat, hogy elkerüljék a holtpontokat ( Deadlocks , Livelocks ) és más folyamatvezérlési problémákat. Az ilyen irányelveket gyakran önkényesen hajtják végre és hibásak, és amikor problémák merülnek fel, nehéz reprodukálni és hibakeresni őket.
Ez prioritás-inverzióhoz vezethet , egy olyan jelenséghez, amelyben egy magas prioritású szál kénytelen várni egy alacsony prioritású szálra, amely kizárólagos hozzáféréssel rendelkezik a szükséges erőforrásokhoz.

Ellenkezőleg, a tranzakciós memória fogalma sokkal egyszerűbb, mivel minden tranzakció külön-külön, egyszálú számításnak tekinthető. A holtpontokat vagy teljesen megakadályozza, vagy egy külső tranzakciókezelő feloldja; a programozónak aligha kell emiatt aggódnia. A prioritás inverziója továbbra is problémát jelenthet, de a magas prioritású tranzakciók megszakíthatják a még nem véglegesített, ütköző alacsony prioritású tranzakciókat.

Másrészt a sikertelen tranzakciók megszakítása is korlátozza a viselkedésüket: nem hajthatnak végre olyan műveleteket, amelyeket nem lehet visszavonni, beleértve a legtöbb I/O-t is. Az ilyen korlátokat a gyakorlatban rendszerint áthidalják pufferek létrehozásával, amelyek visszafordíthatatlan műveleteket sorba állítanak, és egy idő után végrehajtják azokat bármely tranzakción kívül. A Haskellben ezt a korlátozást a típusrendszer hajtja végre a fordításkor.

Összeállítható műveletek

2005-ben Tim Harris, Simon Marlow, Simon Peyton-Jones és Maurice Herlihy egy Haskellben épített STM-rendszert írt le, amely párhuzamosságot valósít meg. Ez a rendszer lehetővé teszi tetszőleges atomi műveletek kombinálását nagyobb atomi műveletekké, ami a zárprogramozással nem lehetséges. A szerzők szerint:

„Talán a legalapvetőbb hátrány az, hogy a zárprogramok nem tudnak linkelni: előfordulhat, hogy a megfelelő töredékek nem működnek, ha összekapcsolják őket. Vegyünk például egy hash-táblázatot szálbiztos beszúrásokkal és törlésekkel. Most tegyük fel, hogy el akarunk távolítani egy elemet a t1 táblából, és beilleszteni a t2 táblába, de a köztes állapot (amikor egyetlen tábla sem tartalmazza ezt az elemet) ne legyen látható más szálak számára. Amíg a hash tábla tervezője nem határozza meg ezt az igényt, egyszerűen nincs mód ennek a követelménynek a kielégítésére. Általában minden helyes művelet (beszúrások, törlések) nem kombinálható nagyobb helyes műveletekké.

– (Tim Harris et al., "Composable Memory Access Operation", 2. rész. Háttér, 2. o.)

Az STM-mel ez a probléma egyszerűen megoldható: ha két műveletet egyszerűen kombinálunk egy tranzakcióban, az összeállítható művelet atomi műveletté válik. Az egyetlen akadály az, hogy a hívó fél számára, aki nem ismeri a link metódusok megvalósítási részleteit, nem világos, hogy mikor kell újra próbálkoznia a tranzakcióval, ha az nem történik meg. Erre válaszul a szerzők egy újrapróbálkozási parancsot javasoltak, amely a sikertelen tranzakció által generált tranzakciós naplót (naplófájlt) használja az olvasott memóriarész meghatározására. Ezután automatikusan újraindítja a tranzakciót, ha a memóriahelyek egyike megváltozik. Ez azon a logikán alapul, hogy egy tranzakció addig nem fog másképp viselkedni, amíg legalább egy ilyen érték meg nem változik.

A szerzők alternatívák létrehozásának mechanizmusát is javasolták (az orElse függvényt). Elindít egy tranzakciót, és ha a tranzakció újra próbálkozik, elindít egy másodikat. Ha ugyanez történik a másodikkal is, a mechanizmus mindkettőt újra elindítja, amíg jelentős változás nem következik be. Ez a POSIX hálózati szabványos select() függvényhez hasonló funkció lehetővé teszi a hívó számára, hogy egyszerre több eseményre várjon. Az interfész programozását is leegyszerűsíti, például egyszerű konverziós mechanizmust biztosít a blokkoló és a nem blokkoló műveletek között.

Ezt a sémát a Haskell GHC fordítóprogramban valósították meg .

Javasolt segédnyelv

Az STM rendszerek fogalmi egyszerűsége lehetővé teszi a programozó számára, hogy könnyedén dolgozzon velük a nyelv viszonylag egyszerű szintaxisával. Tim Harris és Keir Fraser An Auxiliary Language for Lightweight Transactions című könyvében javasolta a klasszikus feltételes kritikus régió (CCR) használatát a tranzakciók ábrázolására. A legegyszerűbb formájában ez csak egy "atomi blokk", egy kódrészlet, amely szekvenciálisan végrehajtódik egyetlen időpontban:

// Csomópont atomi beszúrása egy duplán linkelt listába atom { newNode->prev = csomópont; newNode->next = csomópont->következő; csomópont->következő->előző = newNode; csomópont->következő = newNode; }

A blokk végére érve a tranzakció lehetőség szerint véglegesítésre kerül, ellenkező esetben megszakad és megismétlődik. A feltételes kritikus régiók egy perzisztencia feltételt is lehetővé tesznek, ami lehetővé teszi, hogy a tranzakció várjon, amíg a feladata hatályba lép.

atomic (queueSize > 0) { távolítsa el az elemet a sorból, és használja }

Ha a feltétel sikertelen, a tranzakciókezelő megvárja, amíg egy másik, a feltételt befolyásoló esemény bekövetkezik, mielőtt újra próbálkozna. Ez a laza kommunikáció a gyártók és a fogyasztók között javítja a modularitást a szálak közötti egyértelmű jelzéshez képest. A Composable Memory Access tovább megy az újrapróbálkozási paranccsal (lásd fent), amely bármikor megszakíthatja a tranzakciót, és megvárja, amíg a művelet által korábban beolvasott érték megváltozik, mielőtt újra próbálkozna. Példa:

atom { if (queueSize > 0) { távolítsa el az elemet a sorból, és használja } más { próbálja újra } }

Ez a dinamikus újrapróbálkozás képessége a tranzakció végén leegyszerűsíti a programozási modellt és új lehetőségeket nyit meg.

Az egyik probléma a kivételek viselkedése, amikor a tranzakciókon kívül terjednek. Az "A Composable Memory Access Operation"-ban a szerzők úgy döntöttek, hogy ezzel meg kell szakítani a tranzakciót, mivel a kivételek általában a Haskell váratlan hibáit jelzik (egyidejűleg), de ez a kivétel tárolhatja a megadott információkat és elolvashatja a tranzakció során. a diagnosztikából. Hangsúlyozzák, hogy más tervezési döntések más paraméterek mellett is ésszerűek.

Tranzakciós zárolás

Az STM zárolás nélküli és zárható algoritmusként is megvalósítható. Kétféle blokkolás létezik.

Műveleti ütközési zárolás (Enals, Saha és Harris), ahol a memória írása úgy történik, hogy először ideiglenesen zároljuk az adott memóriaterületet, közvetlenül beírjuk az értékeket és naplózzuk a műveleti visszaállítási naplóba.
Tranzakciózárolás, amely csak a fázis folyamata alatt zárolja a memóriacellákat.

A "Tranzakciós zárolás-2" nevű tranzakció-végrehajtási séma, amelyet a Dice, Shalev és Shavit valósított meg, globális időt használ. Minden tranzakció az aktuális időérték beolvasásával kezdődik, és eltárolja azt olvasásra. Ezután minden olvasáskor és íráskor összehasonlítják a megadott memóriaterület verzióját az olvasási verzióval, és ha nagyobb, akkor a tranzakció törlődik. Ez biztosítja, hogy a kód a memória megfelelő másolatán fut le. A véglegesítés során az összes olvasási régió zárolásra kerül, és az összes írási és olvasási memóriarégió adott verziójának értékei újraellenőrzésre kerülnek. Végül a globális idő növekszik, a naplóbejegyzés új értékei visszaíródnak a memóriába az idő új verziójával.

Egyre népszerűbb módszer a tranzakciós memóriában lévő tranzakciós konfliktusok kezelésére , különösen az STM-ekben, az a sorrend,(CO). A zárolás nélküli rendelés (vagyis az ütköző tranzakciók zárolásának és csak a tranzakció véglegesítésének zárolásának) elérésére szolgál a tranzakciók átrendezésével (pl. Ramadan et al. 2009 és Zhang et al. 2006). A rendezés az alapja a tranzakciós memória helyes állapotának (amikor párhuzamos tranzakciókat hajtanak végre). Az STM-ről már több tucat közlemény és szabadalom jelent meg a "végrehajtási sorrend" használatával.

A "Zhang et al., 2006" a "Tranzakciós rendelési szoftver és konfliktuskezelés" című amerikai egyesült államokbeli szabadalom (amely az 5 701 480 számú amerikai egyesült államokbeli Order Order-re hivatkozik). Íme a részletek:

„Különféle technológiák és módszerek fejlesztés alatt állnak a végrehajtási sorrend alkalmazására egy szoftveres tranzakciós memóriarendszerben. A program tranzakciós memóriarendszere olyan funkcióval van felszerelve, amelyre előre meghatározott végrehajtási sorrend alkalmazható sok művelet. A rendszer az előre meghatározott véglegesítési sorrendet használja futás közben annak megállapítására, hogy milyen sorrendben tranzakciókat hajt végre a szoftveres tranzakciós memóriarendszerben. A konfliktuskezelési folyamat akkor indul el, amikor konfliktus az első és a második tranzakció között. Az előre meghatározott commit sorrendet használják a konfliktuskezelési folyamatban, annak meghatározása, hogy melyik tranzakció nyerje meg a konfliktust, és hagyja azt folytatni."

A véglegesítési megbízásnál a rendelés kívánt tulajdonsága úgy érhető el, hogy a tranzakciókat csak a prioritási sorrendnek megfelelő időrendi sorrendben hajtják végre (a műveletek időrendi sorrendje szerint ütközések esetén)

Megvalósítások

Az SRTM-et (változó minőségű és stabilitású) különféle programozási nyelveken implementálták. Úgymint:

C/C++

TBoost.STM (korábban DracoSTM) A CU-Boulder és a Boost Libraries Group együttműködése során létrejött egy könyvtár a C++ STM számára, elsősorban Justin E. Gottschlich és Jeremy G. Siek által.
TinySTM időalapú STM és Tanger az STM integrációjához C és C++ nyelven LLVM-en keresztül.
Lightweight Transaction Library (LibLTX), C implementációja (Robert Ennals) a fő hangsúly a hatékonyságon van. A megvalósítás alapja a "Szoftvertranzakciós memória nem lehet akadálymentes" és "Gyorsítótárérzékeny szoftvertranzakciós memória" című cikkein.
LibCMT , a Duilio Protti nyílt forráskódú C implementációja, amely a „Composable Memory Transactions”-on alapul. Ez a megvalósítás magában foglalja a C# kötést is .
A TARIFA egy prototípus, amely megvalósítja az "atomi" kulcsszót C/C++ nyelven.
Intel STM Compiler Prototype Edition Az STM for C/C++ megvalósítása közvetlenül a fordítóban (Intel Compiler) Linux vagy Windows rendszerhez, 32 vagy 64 bites kódot generálva Intel és AMD processzorokhoz. Megvalósítja az "atomi" kulcsszót, és lehetőséget biztosít a függvénydefiníciók díszítésére (declspec), hogy szabályozza/engedélyezze a használatát az "atomi" szakaszokban.
Az stmmap egy osztott memórián alapuló STM-megvalósítás C nyelven. Úgy tervezték, hogy a szálak és/vagy folyamatok (nem csak a folyamaton belüli szálak között) memóriamegosztást biztosítson a tranzakciós szemantikával. A C++ ennek az allokátornak egy többszálas változatát valósítja meg .
STM CTL implementációja C nyelven, TL2 alapú, de számos kiterjesztéssel és optimalizálással.
Tim Harris és Keir Fraser számos implementációja a Language Support for Lightweight Transactions, a Practical Lock Freedom és a hamarosan megjelenő, kiadatlan munkák ötlete alapján.
RSTM University of Rochester STM, amelyet Michael L. Scott által vezetett tudóscsoport írt .
A G++ 4.7 már támogatja a C/C++ STM-et közvetlenül a fordítóban. Ez a funkció még kísérleti jellegű, de biztosítja a teszteléshez szükséges funkciókat.

C#

SXM implementáció a C# Microsoft Research számára . Dokumentáció , Letöltési oldal (nem elérhető link) .
LibCMT , egy nyílt forráskódú implementáció (Duilio Protti), amely a "Composable Memory Transactions" alapú. A megvalósítás C# kötést is tartalmaz .
Az NSTM , egy teljesen C# nyelven írt .NET szoftveres tranzakciós memória, beágyazott tranzakciókat és akár a System.Transactions-szal való integrációt is kínál.
MikroKosmos Ellenőrzés-orientált modell STM implementációja C# nyelven.

Clojure

A Clojure STM támogatás a nyelv magjába van beépítve.

Common Lisp

A CL-STM egy többplatformos STM-megvalósítás a Common Lisp számára.

Haskell

Az STM -könyvtár a Composable Memory Transactions részben leírtak szerint a Haskell Platform része .

Java

SCAT kutatócsoport megvalósítása AtomJava.
A JVSTM megvalósítja a João Cachopo és António Rito Silva, a Software Engineering Group tagjai – INESC-ID – által javasolt Versioned Boxes koncepciót.
Az XSTM nyílt forráskódú Java és .NET számára, bővíthető architektúrával. Az XSTM könyvtárként van megvalósítva, és bővítményeket biztosít a változásértesítéshez, a perzisztenciához és az objektumreplikációhoz.
Deuce fejlesztői környezet Java szoftver tranzakciós memóriához bájtkóddal.
Multiverse Java 1.6+ szoftveres tranzakciós memórián (STM) alapuló. Ez a megvalósítás a Multi Version Concurrency Control-t (MVCC) használja párhuzamos vezérlőmechanizmusként.
A DSTM2 Sun Lab Dynamic STM könyvtára.
ObjectFabric STM disztribúció.

OCaml

A coThreads és egyben az OCaml programkönyvtár az STM-et (eredetileg STMLib ) kínálja modulként. A könyvtár bármely más összetevőjéhez hasonlóan az STM-modul is használható VM-szintű szálakkal, szálak és folyamatok rendszerével.

Perl

A Perl 6 - hoz készült STM -et Pugs - ban valósították meg a Glasgow Haskell Compiler STM-könyvtárán keresztül.

Python

A Durus egy egyszerű, de teljes és gyors STM-megvalósítás a Python számára , amely lehetővé teszi az STM használatát egyetlen folyamaton belül, illetve az STM használatát kiszolgáló/több kliens architektúrában. A beágyazott memóriaformátumon kívül más is létezik, például a Berkeley DB itt érhető el .
Fork of CPython atomzárakkal Archiválva : 2012. március 25., a Wayback Machine - Armin Rigo elmagyarázza a CPython javítását a pypy-dev listának küldött e-mailben .
pypy-stm Archivált : 2013. december 5. a Wayback Machine -nél , egy PyPy-bővítmény a Python 2.7 interpreter működő implementációjával, amely támogatja a meglévő többszálas alkalmazások szálainak egyidejű végrehajtását különböző CPU-magokon.

scala

ScalaSTM Könnyű könyvtár STM a Scalához.
RadonSTM STM for Scala, amelyet az Activate Framework projekt részeként valósítottak meg

Smalltalk

GemStone/S [1] Tranzakciós memóriaobjektum szerver Smalltalk számára.

Egyéb nyelvek

A Sun által kifejlesztett Fortress nyelv a DSTM2 -t használja
STM.NET

Jegyzetek

↑ Tom Knight. Egy architektúra többnyire funkcionális nyelvekhez. Archiválva : 2013. november 1., a Wayback Machine Proceedings of the 1986 ACM Conference on LISP és funkcionális programozás.
↑ Maurice Herlihy és J. Eliot B. Moss. Tranzakciós memória: architekturális támogatás a zárolásmentes adatstruktúrákhoz. A 20. éves nemzetközi számítógépes architektúra szimpózium (ISCA '93) anyaga. 21. évfolyam, 2. szám, 1993. május.
↑ Simon Peyton-Jones. Programozás a párhuzamosság korában: Szoftvertranzakciós memória . 9. csatorna. Letöltve: 2007. június 9. Az eredetiből archiválva : 2012. szeptember 2.. (határozatlan)

Linkek

Morry Katz, PARATRAN: Átlátszó tranzakció alapú futásidejű mechanizmus a Scheme párhuzamos végrehajtásához , MIT LCS, 1989
Nir Shavit és Dan Touitou. Szoftver tranzakciós memória . Proceedings of the 14th ACM Symposium on Principles of Distributed Computing , pp. 204–213. 1995. augusztus. Az STM-ből származó papír.
Maurice Herlihy, Victor Luchangco, Mark Moir és William N. Scherer III. Szoftver tranzakciós memória dinamikus méretű adatstruktúrákhoz . A huszonkettedik éves ACM SIGACT-SIGOPS Symposium on Principles of Distributed Computing (PODC) anyaga, 92-101. 2003. június
Tim Harris és Keir Fraser. Nyelvi támogatás a könnyű tranzakciókhoz . Objektum-orientált programozás, rendszerek, nyelvek és alkalmazások , pp. 388–402. 2003. október.
Tim Harris, Simon Marlow, Simon Peyton Jones és Maurice Herlihy. Összeállítható memória-tranzakciók . ACM Symposium on Principles and Practice of Parallel Programming 2005 (PPoPP'05). 2005.
Robert Annals. A szoftvertranzakciós memória nem lehet akadálymentes .
Michael L. Scott et al. A nem blokkoló szoftveres tranzakciós memória többletterhelésének csökkentése nemcsak az RSTM-hez nyújt jó bevezetőt, hanem a meglévő STM-megközelítéseket is.
Torvald Riegel és Pascal Felber és Christof Fetzer, A Lazy Snapshot Algorithm with Eager Validation bemutatja az első időalapú STM-et.
Dave Dice, Ori Shalev és Nir Shavit. Tranzakciós zárolás II .
Knight, TF, Egy architektúra többnyire funkcionális nyelvekhez , ACM Lisp és Funkcionális programozási konferencia, 1986. augusztus.
Knight, TF, Rendszer és módszer párhuzamos feldolgozáshoz többnyire funkcionális nyelvekkel, 4 825 360 számú amerikai egyesült államokbeli szabadalom, 1989. április.
Ali-Reza Adl-Tabatabai, Christos Kozyrakis, Bratin Saha, Unlocking concurrency , ACM Queue 4, 10 (2006. december), 24–33. Összeköti a többmagos processzorokat és az STM iránti kutatást/érdeklődést.
James R Larus, Ravi Rajwar, Transactional Memory , Morgan and Claypool Publishers, 2006.
Leonyid Csernyak. Tranzakciós memória – első lépések // Nyílt rendszerek, 2007. 04. szám