Az anarchia ára ( angolul Price of Anarchy , PoA ) [1] egy olyan közgazdaságtani és játékelméleti fogalom , amely azt méri, hogy a rendszer hatékonysága mennyire csökken ügynökeinek önző viselkedése miatt .
Az anarchia költsége egy általános fogalom, amely kiterjeszthető különböző rendszerekre és hatékonysági koncepciókra. Vegyünk például egy közlekedési rendszert egy olyan városban, ahol sok ügynök próbál eljutni valamelyik kiindulási ponttól egy végpontig. Jelenítse a hatékonyság ebben az esetben azt az átlagos időt, ameddig az ügynök eljut a rendeltetési helyre. Egy "központosított" megoldásban a központi hatóság megmondhatja minden ügynöknek, hogy az ügynöknek melyik útvonalat kell megtennie az átlagos utazási idő minimalizálása érdekében. A „decentralizált” változatban minden ügynök saját belátása szerint választja ki az útvonalat. Az anarchia ára e két esetben az átlagos utazási idők arányát tükrözi.
A rendszert általában játékként modellezik , és a hatékonyság a játék kimenetelének valamilyen függvénye (pl. maximális hálózati késleltetés, forgalmi torlódás, aukciókon nyújtott társadalmi haszon stb.). Különféle egyensúlyi fogalmak használhatók az ágensek önző viselkedésének modellezésére, ezek közül a legáltalánosabb a Nash-egyensúly . A Nash-egyensúly különböző változatai az anarchia költség fogalmának eltéréseihez vezetnek, mint például a tiszta anarchia költség (determinisztikus egyensúlyok esetén), vegyes anarchia költség (véletlenszerű egyensúly esetén) és Bayes-Nash anarchia költség (hiányos információkat tartalmazó játékok esetén). A Nash-egyensúlytól eltérő fogalmak olyan opciókhoz vezetnek, mint például a merítés ára [2] .
Az "anarchia ára" kifejezést először Elias Koutsoupias és Christos Papadimitriou [1] használta , de az egyensúlyi hatástalanság mérésének ötlete régebbi [3] . A koncepciót jelenlegi formájában a közelítési algoritmusban a "közelítési tényezővel" vagy az online algoritmusban a "versenyképességi szinttel" analógnak szánták . A kifejezés összhangban van az algoritmikus lencséket használó játékelemzés modern irányzatával ( Algorithmic Game Theory ).
Tekintsünk egy játékot , amelyet játékosok halmaza határoz meg, az egyes játékosok stratégiái és egy segédfüggvény (amit eredményhalmaznak is neveznek). Az egyes eredmények hatékonyságának mértékét meghatározhatjuk, amelyet haszonfüggvénynek nevezünk . A természetes jelöltek közé tartozik a játékosok hasznosságának összege (cél segédprogramok), a minimális hasznosság (cél méltányosság vagy egalitarizmus) ..., vagy bármely olyan funkció, amely az elemzett játék szempontjából értelmes, és amelyet maximalizálni kell.
Egy részhalmazt az egyensúlyi stratégiák halmazaként definiálhatunk (például a Nash-egyensúlyok halmaza ). Az anarchia költségét ezután az optimális „centralizált” megoldás és a „legrosszabb egyensúly” arányaként határozzuk meg:
Ha a maximalizálni kívánt "jó" helyett a hatékonyságmérő függvény az a "költségfüggvény" , amelyet minimalizálni szeretnénk (például a hálózati késések), akkor (a közelítő algoritmusokban elfogadott konvenciókat követve):
Ehhez kapcsolódó fogalom a Stabilitás ára ( PoS ) , amely a "legjobb egyensúly" és az optimálisan "centralizált" megoldás közötti kapcsolatot méri:
vagy költségfüggvények esetén:
Ezt definícióból tudjuk. A játékelméleti korlátok miatti hatékonyságvesztés várhatóan valahol a PoS és a PoA között lesz.
Mindkét értéket, a PoS-t és a PoA-t különböző típusú játékokra számítottuk ki. Néhány példa az alábbiakban látható.
Tekintsük a Prisoner 's Dilemma nevű 2x2-es játékot , amelyet a következő költségmátrix adja meg:
Együttműködik | elárul | |
---|---|---|
Együttműködik | 1 ; egy | 7 ; 0 |
elárul | 0 ; 7 | 5 ; 5 |
és legyen az árfüggvény. Most a minimális ár akkor lesz, ha mindkét játékos együttműködik, és a kapott ár a következő lesz . A Nash-egyensúly azonban csak akkor figyelhető meg, ha mindkettő elárulja, ebben az esetben az ár . Ekkor ennek a játéknak a PoA értéke egyenlő lesz .
Mivel a játéknak egyedi Nash-egyensúlya van, a PoS értéke PoA, ami szintén 5.
Természetesebb példa az egyik munkaütemezési probléma . Vannak játékosok, és mindegyiküknek van tennivalója. A munka elvégzésére választhatnak egyet a gépek közül. Az anarchia költsége összehasonlítja azt a helyzetet, amikor a gépek kiválasztását központilag határozzák meg, és egy olyan helyzetet, amikor minden játékos úgy választ egy autót, hogy gyorsabban végezze el munkáját.
Minden gépnek van sebessége Minden munkának súlya van A játékos kiválaszt egy gépet a feladat elvégzéséhez. Így minden játékos stratégiája a következőképpen alakul : Határozza meg a gép terhelését :
A játékos ára egyenlő , azaz megegyezik a játékos által választott gép terhelésével. Figyelembe vesszük az egalitárius árfüggvényt , amelyet itt feldolgozási időszaknak nevezünk .
Az egyensúly két fogalmát fogjuk megvizsgálni – a tiszta Nash-stratégiát és a vegyes Nash-stratégiát . Nyilvánvaló, hogy a vegyes PoA tiszta PoA, mivel bármely tiszta Nash-egyensúly egyben vegyes Nash-egyensúly is (az egyenlőtlenség szigorúnak bizonyulhat példáulha, ). Az első dolog, amit meg kell tennünk, hogy megmutatjuk a tiszta Nash-egyensúly létezését.
nyilatkozat . Minden álláselosztási játékhoz létezik legalább egy Nash-egyensúlyi tiszta stratégia.
Bizonyíték . Társadalmilag optimális stratégiát kell kialakítanunk . Ez egyszerűen egy olyan stratégiát jelenthet, amelynek feldolgozási ideje minimális. Ez azonban nem elég. Több ilyen stratégiakészlet is létezhet, amelyek számos különböző terheléseloszlást eredményeznek (mindegyiknek ugyanaz a maximális terhelése). Ezenkívül korlátozzuk magunkat arra a tényre, hogy van egy második legalacsonyabb terhelés. Ez ismét sok lehetséges terheléseloszláshoz vezet, és addig ismételjük a folyamatot, amíg meg nem kapjuk a legjobb (azaz a legkisebb) terhelést, ahol csak egy terheléseloszlás lehet (az egyetlen egy permutációig). Ezt nevezhetjük a rendezett letöltések lexikográfiailag legkisebb vektorának is.
Azt állítjuk, hogy ez egy tiszta stratégiai Nash-egyensúly. Ellentmondásokkal fogjuk bizonyítani. Tételezzük fel, hogy néhány játékos javíthatja a teljesítményét, ha gépről gépre mozog . Ez azt jelenti, hogy az átállás után megnövekedett gépterhelés kisebb marad, mint az átállás előtti gépterhelés. Mivel az átállás következtében a gép terhelése csökkennie kell, és más gépet nem érint, ami azt jelenti, hogy az új konfiguráció garantálja az elosztás -. legnagyobb terhelésének csökkenését. Ez azonban sérti a lexikográfiai minimalitás feltételezését . Q.E.D.
nyilatkozat . Bármely munkaelosztási játék esetében a tiszta stratégiai PoA nem haladja meg a .
Bizonyíték . Könnyű felülről megkötni a kapott jószágot bármely Nash -egyensúlyi vegyes stratégiaként a képlettel
Az egyértelműség kedvéért vegye figyelembe a tiszta stratégiák bármely halmazát , akkor egyértelmű
Mivel a fentiek a társadalmi optimumra is érvényesek, az arányok összehasonlítása igazolja az állítást. Q.E.D
Vegyünk egy olyan úthálózatot, amelyen meghatározott számú járművezetőnek kell eljutnia egy közös kezdőponttól egy közös végpontig. Tételezzük fel, hogy minden vezető önző módon választ egy útvonalat, és az utazási idő lineárisan függ az útvonalat választó járművezetők számától.
Ezeket a feltételeket útvonalválasztási problémaként formalizálhatjuk egy irányított összefüggő gráfban , amelyben egy áramlási egységet akarunk küldeni egy forráscsomópontból egy nyelőcsomópontba (képzeljük el, hogy az áramlás különböző meghajtók választott útvonalaiból áll). Legyen az áramlás olyan függvény, amely minden élhez egy nem negatív valós számot rendel, és vegyünk egy sor lineáris függvényt , amely az élen keresztüli áramlást az él késleltetésére képezi le. Határozzuk meg a flow társadalmi javát is úgy
Tekintsük az ábrán látható példát - ha pontozott út nem áll rendelkezésre, vegyes stratégiák esetén Nash-egyensúlyt kapunk, ha minden játékos azonos valószínűséggel választja a felső és az alsó útvonalat - ennek az egyensúlynak 1,5 társadalmi költsége van, és 1,5 egységnyi időbe telik, amíg minden járművezető és minden járművezető között átjut a -tól -ig . A hálózaton való áthaladás javításának reményében a jogalkotó dönthet úgy, hogy szaggatott utat nyit meg a kis késéssel közlekedők előtt. Ebben az esetben a Nash-egyensúly csak akkor következhet be, ha bármelyik sofőr használja az új utat, így a társadalmi költség 2-vel nő, és most 2 egységnyi időbe telik minden járművezetőnek eljutni ig .
Ezért szokatlan eredményt kapunk - a gyorsabb út használatának törvényi tilalma bizonyos esetekben pozitív eredménnyel járhat.
A Braes-paradoxonban bemutatott útválasztási probléma ugyanazon a gráfon egyidejűleg sok különböző folyamra általánosítható.
Meghatározás (Általános adatfolyam) . Legyen , és ugyanúgy definiálva, mint fent, és tegyük fel, hogy az értékeket minden egyes csomópontpáron keresztül szeretnénk átadni . Az áramlást úgy definiáljuk, mint a valós nemnegatív számok eloszlását az egyes útvonalak között, amelyek -tól -ig haladnak , korlátozásokkal
Egy adott gráfélen áthaladó áramlást a következőképpen határozzuk meg
A rövidség kedvéért megírjuk, ha a szövegkörnyezetből egyértelmű.
Definíció (Nash-egyensúlyi áramlás) . Az áramlás akkor és csak akkor és csak akkor Nash - egyensúlyi áramlás
Ez a meghatározás szorosan összefügg azzal, amiről beszélünk, amikor egy vegyes stratégia fenntartja a Nash-egyensúlyt a normál formában lévő játékokban.
A (feltételes áramlási jó) definíciója . Legyen és két patak a halmazokhoz és . A továbbiakban a jelölés megkönnyítése érdekében elhagyjuk az indexet. Képzelje el a függvények által generált rögzített késleltetéseket egy grafikonon – a feltételes jószág a következőképpen van definiálva
1. tény . Ha van Nash-egyensúlyi áramlás és bármilyen más áramlás , .
Bizonyítás (ellentétből) . Tegyük fel, hogy . Definíció szerint,
.Mivel és ugyanazokhoz a halmazokhoz kapcsolódnak , ezt tudjuk
Ezért kell lennie egy párnak és két olyan útnak , amelyre , , és
Más szóval, egy áramlás csak kisebb haszonhoz juthat, mint ha két útvonalon eltérő árai vannak, és ha átirányít egy áramlást egy magas költségű útvonalról egy alacsonyabb költségű útvonalra. Nyilvánvaló, hogy ez a helyzet összeegyeztethetetlen azzal a feltételezéssel, hogy egy Nash-egyensúlyi áramlás. Q.E.D.
Ne feledje, hogy az 1. tény nem jelent semmilyen meghatározott halmazstruktúrát .
2. tény . Ha két valós szám és , adott .
Bizonyíték . Ez egy másik módja a helyes egyenlőtlenség kifejezésének . Q.E.D.
Tétel . A tiszta stratégia PoA értéke bármely általánosított útválasztási problémára lineáris késleltetéssel egyenlő .
Bizonyíték . Vegyük észre, hogy ez a tétel egyenértékű azzal, hogy minden Nash-egyensúlyi áramlás , , ahol bármely más áramlás. Definíció szerint
A 2. tényt használva azt kapjuk
mert a
Megállapíthatjuk, hogy , és igazolni kellett az állítást az 1. tény segítségével, amelyet bizonyítani kellett.
Megjegyezzük, hogy a bizonyítás során széles körben alkalmaztuk azt a feltételezést, hogy a függvények lineárisak. Valójában általánosabb tények érvényesek.
Tétel . Adott egy általánosított útválasztási probléma gráfon és polinomiális fokozatú késleltetési függvények nem negatív együtthatókkal, a PoA egy tiszta stratégia .
Vegye figyelembe, hogy a PoA . Tekintsük az ábrán látható példát, ahol egységnyi áramlást feltételezünk: A Nash-egyensúlyi áramlások társadalmi jószága 1. A legjobb jót azonban akkor érjük el , ha ebben az esetben
Az érték a végtelenhez közeledve a nullához közelít.
Játékelmélet | |
---|---|
Alapfogalmak | |
A játékok típusai |
|
Megoldási koncepciók | |
Játékpéldák | |