A digitális tipográfiában a kombinálható karakterek olyan karakterek, amelyeket más karakterek módosítására terveztek. A latin nyelvben a leggyakoribb kombinálható karakterek a kombinálható diakritikus karakterek (beleértve a kombinálható ékezeteket is ).
A Unicode sok előre összeállított karaktert is tartalmaz, így sok esetben mind a kombinálható diakritikus, mind a felhasználó vagy az alkalmazás által választott előre összeállított karakterek használhatók. Ez ahhoz a követelményhez vezet, hogy két Unicode-karakterlánc összehasonlítása előtt Unicode-normalizálást kell végrehajtani, és gondosan meg kell tervezni a kódoló konvertereket, hogy az összes érvényes Unicode-karakterreprezentációt megfelelően leképezzék az örökölt kódolásra az adatvesztés elkerülése érdekében.
A Unicode-ban az európai nyelvek és a nemzetközi fonetikus ábécé kombinálható diakritikusainak fő blokkja az U+0300…U+036F . A diakritikus karakterek kombinálása sok más Unicode blokkban is megjelenik. A Unicode-ban a diakritikus jelek mindig az alapkarakter után kerülnek elhelyezésre (ellentétben néhány régebbi, kombinálható karakterkészlettel, mint például az ANSEL ), ami lehetővé teszi több diakritikus jelölés hozzáadását egyetlen karakterhez, bár 2010 óta kevés alkalmazás támogatja az ilyen kombinációk helyes megjelenítését.
A kombinált karaktereket az úgynevezett „Zalgo-szöveg” létrehozására is használják – olyan szöveget, amely a túlzott diakritika használata miatt torznak tűnik. Emiatt a szöveg függőlegesen kitágul, átfedve a többi szöveget [1] .
Példap̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈ÿ͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗̇̈y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛ŷ̀͋̉͗̎̽͐̍̀͊ỷ̍̿̉̉̆͒̀̃͛̈y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿̇y̎͒̌̓̎̊͋͛ẙ̅̃̇͛̄̽̒̋̋̇͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̇͊y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈ÿ̆̊̏͐̈ỳ̃̍͊̈y̓̽̃͒̀̆̀ R
A Unicode a következő blokkokat tartalmazza kifejezetten a kombinálható diakritikus jelölésekhez:
A Unicode karaktereinek egyik jellemzője a kanonikus kombinálhatósági osztály, amely csak numerikus értékeket fogad el [2] .
Jelentése | Teljes angol cím | Orosz fordítás | Leírás |
---|---|---|---|
0 | Not_Reordered | Nem meghatározott | Nem kombinálható és keretező táblák; a magánhangzók és mássalhangzók sok jele is, még ha kombinálhatók is |
egy | átfedés | átfedő jel | Alapbetűre vagy szimbólumra ráhelyezett karakterek |
7 | Nukta | Nuqta | Nukta - Brahmiból származó jel az írásrendszerekben |
nyolc | Kana_Voicing | Hangos kana jelek | Hangos jelek kana - dakuten és handakuten |
9 | Virama | Virama | A Virama egy brahmiból származó jel az írásrendszerekben |
10-199 | Ccc10–Ccc199 | Kanonikus kombinálhatósági osztályok 10-199 | Fix pozíciós osztályok |
200 | Mellékelt_Alul_Bal | Kapcsolattartó jel balra lent | |
202 | Alább csatolva | Kapcsolatfelvétel lent | |
204 | — | ||
208 | — | ||
210 | — | ||
212 | — | ||
214 | Attached_Above | Kapcsolattartó jel felülről | |
216 | Mellékelve_jobbra_felül | Kapcsolattartó jel a jobb felső sarokban | |
218 | Below_Left | Jelzés bal alsó | |
220 | Lent | jel alulról | |
222 | Below_Right | Jobb alsó jel | |
224 | Bal | Jelölje be a bal oldalon | |
226 | Jobb | Helyes jel | |
228 | Above_Left | Bal felső jel | |
230 | Felett | jel felülről | |
232 | Fent_Right | Jobb felső jel | |
233 | Double_Below | alatta kettős jel | |
234 | Double_Above | kettős jel a tetején | |
240 | Iota_Subscript | Interlineáris iota | Csak görög alsó index |