Optimalizáló fordító

Az optimalizáló fordító egy olyan fordító , amely különféle módszereket használ, hogy optimálisabb programkódot kapjon, miközben megőrzi funkcionalitását. A leggyakoribb optimalizálási célok a következők: a programvégrehajtási idő csökkentése, a teljesítmény növelése, a programkód tömörítése, a memória megtakarítása, az energiaköltségek minimalizálása, az I/O műveletek számának csökkentése .

Az optimalizálás implicit módon megtörténhet a program fordítása során, de általában a fordítói munka külön lépésének tekintik. A linkerek az optimalizálás egy részét is végrehajthatják, például eltávolíthatják a nem használt szubrutinokat vagy átrendezhetik őket .

Az optimalizálás általában optimalizáló transzformációk sorozatán keresztül valósul meg, olyan algoritmusokon keresztül , amelyek egy programot használnak, és módosítják azt, hogy egy szemantikailag egyenértékű változatot hozzanak létre, amely hatékonyabb az optimalizálási célok bizonyos csoportjai számára. Egyes kódoptimalizálási problémákról bebizonyosodott, hogy NP-teljesek [1] , vagy akár eldönthetetlenek [2] . Ennek ellenére gyakorlatilag sok közülük heurisztikus módszerekkel van megoldva, amelyek meglehetősen kielégítő eredményeket adnak.

Tegyen különbséget az alacsony és a magas szintű optimalizálás között. Az alacsony szintű optimalizálás elemi utasítások szintjén alakítja át a programot, például egy adott architektúra processzorának utasításait . A magas szintű optimalizálás a program szerkezeti elemeinek, például modulok, függvények, ágak, ciklusok szintjén történik.

Az optimalizálás típusai

Az optimalizálás során alkalmazott módszerek hatókör szerint osztályozhatók: érinthetnek egyetlen utasítást és egy egész programot is. A lokális (a program egy kis részét érintő) módszerek könnyebben megvalósíthatók, mint a globális módszerek (a teljes programra vonatkoztatva), de a globális módszerek gyakran előnyösebbek.

Kukucskáló optimalizálás

A lokális kukucskáló optimalizálások több szomszédos ( a programábrázolás egyik grafikonja szempontjából) utasítást figyelembe vesznek (mintha „a kukucskálón keresztül néznénk ” a kódon), hogy megnézzék, lehet-e velük bármilyen transzformációt végrehajtani az optimalizálás szempontjából. cél. Különösen helyettesíthetők egyetlen utasítással vagy egy rövidebb utasítássorozattal.

Például egy szám megkettőzését hatékonyabban lehet elvégezni balra tolással, vagy a szám hozzáadásával.

Helyi optimalizálás

A lokális optimalizálás során lépésenként csak egy alapblokk információit veszik figyelembe [3] . Mivel az alapblokkban nincsenek vezérlési folyamatátmenetek , ezek az optimalizálások kevés elemzést igényelnek (időt takarítanak meg és csökkentik a memóriaigényt), de ez azt is jelenti, hogy a következő lépéshez nem kerül tárolásra információ.

Intraprocedurális optimalizálás

Az eljáráson belüli optimalizálás ( angolul intraprocedural ) olyan globális optimalizálás, amelyet teljes egészében egy fordítási egység (például függvények vagy eljárások) keretein belül hajtanak végre [4] . Az ilyen optimalizálásnál sokkal több információ jár, mint a lokálisnál, amivel jelentősebb hatások érhetők el, ez azonban sokszor erőforrás-igényes számításokat igényel. Ha az optimalizált programegységben vannak globális változók , az ilyen típusú optimalizálás nehézkes lehet.

Hurok optimalizálás

Számos optimalizálást alkalmaznak a hurkokra. A ciklus nagy számú iterációjával az ilyen optimalizálás rendkívül hatékony, mivel a program végrehajtásának jelentős részét egy kis átalakítás befolyásolja. Mivel a ciklusok sok program végrehajtási idejének jelentős részét teszik ki, szinte minden fordítóprogramban létezik ciklusoptimalizálás, és ezek a legfontosabbak.

Például a ciklusinvariánsok azonosításával néha lehetséges néhány műveletet eltávolítani a hurokból, hogy ne hajtsanak végre redundáns ismételt számításokat.

Interprocedurális optimalizálás

Az ilyen típusú optimalizálás a program teljes forráskódját egyszerre elemzi. Az ezekkel a módszerekkel nyert információ nagyobb mennyisége azt jelenti, hogy az optimalizálás hatékonyabb lehet, mint más módszerek. Az ilyen optimalizálás meglehetősen összetett módszereket alkalmazhat, például egy függvényhívást a függvénytörzs másolatával (inline vagy inline) helyettesítünk.

Példa Legyen néhány függvény:

int pred ( int x ) { ha ( x == 0 ) return 0 ; más visszatérés x - 1 ; }

A beágyazás előtt a kód így nézett ki:

int f ( int y ) { return pred ( y ) + pred ( 0 ) + pred ( y + 1 ); }

Optimalizálás után:

int f ( int y ) { belső hőmérséklet = 0 ; ha ( y == 0 ) hőmérséklet += 0 ; else temp += y - 1 ; /* (egy) */ if ( 0 == 0 ) hőmérséklet += 0 ; különben hőmérséklet += 0 - 1 ; * (2) */ if ( y + 1 == 0 ) hőmérséklet += 0 ; else temp += ( y + 1 ) - 1 ; * (3) */ visszatérő hőmérséklet ; }

A függvénybeillesztés kiküszöböli a függvényhívásokhoz kapcsolódó többletköltséget. Ezenkívül a beillesztés után lehetőség van olyan eljáráson belüli optimalizációk alkalmazására, amelyeket korábban lehetetlen vagy túl nehéz volt megvalósítani. A beépítésnek azonban megvannak a maga hátrányai, mint szinte minden optimalizálásnak – növeli a kód statikus méretét, ami negatív hatásokhoz vezethet a berendezés e tényezőre érzékeny részein.

Az optimalizálást befolyásoló tényezők

Az optimalizálást befolyásoló tényezők közül a célgép számítási jellemzői (például a processzormagok száma és órajele, a processzor gyorsítótárának mérete, a rendszerbusz sávszélessége , a RAM mennyisége) és a cél architektúrája egyaránt. processzor (különösen, a különböző architektúrákban eltérő számú általános célú regiszter áll rendelkezésre, a számítási folyamat másként valósul meg ). Az optimalizálást befolyásoló tényezők másik csoportja a célkódhasználati forgatókönyv, például az optimalizálási célok jelentősen eltérhetnek a hibakeresési és tesztkód, az alkalmi futtatás, a folyamatos használat, a beágyazott vagy önálló alkalmazások esetében.

Általános elvek

A fordítóprogramok különféle optimalizálási módszereiben használt optimalizálási elvek közül (egyesek ellentmondhatnak egymásnak, vagy nem alkalmazhatók különböző optimalizálási célokra):

redundanciacsökkentés: számítási eredmények újrafelhasználása, újraszámítások számának csökkentése;
kódtömörítés: a felesleges számítások és köztes értékek eltávolítása;
az átmenetek számának csökkentése a kódban: például a függvénybeágyazás ( angolul Inline expansion ) vagy a loop unwinding alkalmazása sok esetben lehetővé teszi a program végrehajtásának felgyorsítását a kód méretének növelése árán;
lokalitás: a közeljövőben elérendő kódot és adatot egymás mellé kell helyezni a memóriában a referencia lokalitás elvének követése érdekében ;
memóriahierarchia használata: helyezze el a leggyakrabban használt adatokat az általános célú regiszterekbe, a kevésbé használt adatokat a gyorsítótárba , a még kevésbé használt adatokat a RAM-ba és a legkevésbé használt adatokat a lemezre .
párhuzamosítás: az átrendezési műveletek lehetővé teszik több számítás párhuzamos végrehajtását, ami felgyorsítja a program végrehajtását (lásd a hurok feloldása ).

Specifikus módszerek

Hurok optimalizálás

Induktív változók elemzése ha a hurokban lévő változó egy induktív változó egyszerű lineáris függvényének eredménye, például for (i=0; i < 10; ++i) j = 17 * i;, akkor ezt a változót minden iterációnál megfelelően frissítheti. Ezt a műveletek erősségének csökkentésének nevezzük . A ciklus részekre bontása Az optimalizálás megpróbálja felosztani a hurkot több különálló, azonos indextartományú hurokra. Minden új hurok az eredeti hurok törzsének része. Ez javíthatja a hivatkozások helyét ( lásd a Hivatkozás helye elvét ). Ciklusok kombinálása (Ciklusok összevonása) Egy másik technika, amely megpróbálja csökkenteni a hurok rezsijét. Ha két szomszédos ciklus ugyanannyiszor ismétlődik, akkor testük addig kombinálható, amíg kölcsönhatásba nem lépnek egymással. ciklus inverziója Ez a módszer a szabványos while ciklust feltételes do/while hurokká változtatja, ami kettővel csökkenti az ugrások számát a ciklus végrehajtásakor. Ciklus felosztás Az optimalizálás megpróbálja leegyszerűsíteni a hurkot vagy kiküszöbölni a hurok függőségeit azáltal, hogy több részre osztja fel, amelyeknek ugyanaz az eredeti hurok törzse és különböző számlálótartományai vannak.

Adatfolyam optimalizálás

Az adatfolyam-optimalizálások adatfolyam - elemzésen alapulnak, és általában bemenő adatnak tekintik az egymáshoz kapcsolódó vezérlőfolyam-gráfot és adatfolyam-gráfot, valamint gyakran a vezérlőfolyamat-gráf hurokfáját és hurokcímkéit. Ezeken a grafikonokon különösen az információ terjedését elemezve feltárul az optimalizálás lehetősége a kívánt célok szempontjából, majd az optimalizációkat alkalmazzák.

Gyakori részkifejezések eltávolítása A közös részkifejezések eltávolítása egy olyan fordítóoptimalizálás, amely azonos kifejezések példányait keresi, és elemzi annak lehetőségét, hogy lecseréljék őket egyetlen változóra, amely tartalmazza a számított értéket. Állandók konvolúciója Optimalizálások, amelyek csökkentik a redundáns számításokat azáltal, hogy az állandó kifejezéseket és változókat az értékükre cserélik. Induktív változók elemzése ( eng. Indukciós változók elemzése ) Lásd a leírást a Ciklusoptimalizálás részben . Zsákutca rekordok törlése Törölje a hozzárendeléseket a később nem olvasott változókhoz. A hozzárendelés eltávolítása vagy azért történik, mert a változót nem olvasták be a változó élettartamának vége előtt, vagy azért, mert egy későbbi hozzárendelés felülírja azt.

SSA űrlap és az arra épülő optimalizálás

Az SSA (Single Static Assignment, Single Static Assignment) az adatfolyam-grafikon (DFG) megjelenítésének egyik formája, amelyben minden változóhoz csak egyszer van hozzárendelve érték. Ezzel elkerülhető az ívek megszorzása a grafikonon egy változó többszöri írása és olvasása során, és megkönnyíti a gráfelemzést. Ennek érdekében az SSA nézet speciális Phi függvényeket (adatfolyam gráf csomópontokat) vezet be a vezérlőfolyamat gráf egyes konvergenciapontjain. Ezek az új csomópontok az úgynevezett pszeudo-hozzárendelések.

A többszörös definíciók nem csak a vezérlési folyamatok konvergenciái ("vagy") miatt lehetségesek, hanem azért is, mert lehetőség van néhány összetett érték egészének olvasására, amelyet egynél több művelettel írtak le részekre ("és"). Ebben az esetben az SSA űrlap fenntartása érdekében további pszeudo-hozzárendeléseket vezetnek be az alapblokkon belül, amelyek egy értéket gyűjtenek több közül.

Néhány optimalizálás az SSA-n alapul. Bár néhány közülük SSA nélkül is működhet, akkor a leghatékonyabbak, ha SSA van jelen.

Lásd még

Algoritmus hatékonysága

Jegyzetek

↑ http://www.cs.uiuc.edu/class/fa07/cs498mjg/notes/optimizations.pdf (lefelé mutató hivatkozás) 29-30. oldal: "Regisztrációs kiosztás", "Utasítás ütemezése"
↑ Archivált másolat . Hozzáférés dátuma: 2007. március 25. Az eredetiből archiválva : 2005. április 2.. (határozatlan) 8. oldal, egy teljesen optimalizáló fordító létrehozásának feladatának egyenértékűségéről a Halting problémával
↑ Cooper, Keith D. és Torczon, Linda, Engineering a Compiler, Morgan Kaufmann, 2004, ISBN 1-55860-699-8 , 404. oldal
↑ Cooper, Keith D. és Torczon, Linda, Engineering a Compiler, Morgan Kaufmann, 2004, ISBN 1-55860-699-8 , 407. oldal

Irodalom

Alfred Aho, Monica Lam, Ravi Seti, Jeffrey Ullman. Fordítók: alapelvek, technikák és eszközök = Compilers : Principles, Techniques, and Tools. — 2. kiadás. - M . : "Williams", 2008. - 1184 p. - 1500 példány. - ISBN 978-5-8459-1349-4 .
Steven Muchnick, Advanced Compiler Design and Implementation – Morgan Kaufmann, 1997 – ISBN 1-55860-320-4
Keith Cooper, Linda Torczon, fordítómérnök, második kiadás – Morgan Kaufmann, 2011 – ISBN 978-0-12-088478-0

Linkek

KNOW INTUIT | Bevezetés az alkalmazásoptimalizálásba Intel fordítóprogramokkal | Az információk archiválva 2017. december 24-én a Wayback Machine -nél / Intuit.ru , 2011