Kombinált szimbólum

A digitális tipográfiában a kombinálható karakterek  olyan karakterek, amelyeket más karakterek módosítására terveztek. A latin nyelvben a leggyakoribb kombinálható karakterek a kombinálható diakritikus karakterek (beleértve a kombinálható ékezeteket is ).

A Unicode sok előre összeállított karaktert is tartalmaz, így sok esetben mind a kombinálható diakritikus, mind a felhasználó vagy az alkalmazás által választott előre összeállított karakterek használhatók. Ez ahhoz a követelményhez vezet, hogy két Unicode-karakterlánc összehasonlítása előtt Unicode-normalizálást kell végrehajtani, és gondosan meg kell tervezni a kódoló konvertereket, hogy az összes érvényes Unicode-karakterreprezentációt megfelelően leképezzék az örökölt kódolásra az adatvesztés elkerülése érdekében.

A Unicode-ban az európai nyelvek és a nemzetközi fonetikus ábécé kombinálható diakritikusainak fő blokkja az U+0300…U+036F . A diakritikus karakterek kombinálása sok más Unicode blokkban is megjelenik. A Unicode-ban a diakritikus jelek mindig az alapkarakter után kerülnek elhelyezésre (ellentétben néhány régebbi, kombinálható karakterkészlettel, mint például az ANSEL ), ami lehetővé teszi több diakritikus jelölés hozzáadását egyetlen karakterhez, bár 2010 óta kevés alkalmazás támogatja az ilyen kombinációk helyes megjelenítését.

Zalgo szöveg

A kombinált karaktereket az úgynevezett „Zalgo-szöveg” létrehozására is használják  – olyan szöveget, amely a túlzott diakritika használata miatt torznak tűnik. Emiatt a szöveg függőlegesen kitágul, átfedve a többi szöveget [1] .

Példa

p̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈ÿ͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈̈͌̇͗̏̔̓̓̐̇̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗̇̈y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿̇͊̍͋̏̏͊͛ŷ̀͋̉͗̎̽͐̍̀͊ỷ̍̿̉̉̆͒̀̃͛̈y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿̇y̎͒̌̓̎̊͋͛ẙ̅̃̇͛̄̽̒̋̋̇͂̋̐̈͐̆͑̎̂̔͂͊̈y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̇͊y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈ÿ̆̊̏͐̈ỳ̃̍͊̈y̓̽̃͒̀̆̀ R

Tartományok Unicode-ban

A Unicode a következő blokkokat tartalmazza kifejezetten a kombinálható diakritikus jelölésekhez:

Kanonikus kombinálhatósági osztály

A Unicode karaktereinek egyik jellemzője a kanonikus kombinálhatósági osztály, amely csak numerikus értékeket fogad el [2] .

Jelentése Teljes angol cím Orosz fordítás Leírás
0 Not_Reordered Nem meghatározott Nem kombinálható és keretező táblák; a magánhangzók és mássalhangzók sok jele is, még ha kombinálhatók is
egy átfedés átfedő jel Alapbetűre vagy szimbólumra ráhelyezett karakterek
7 Nukta Nuqta Nukta - Brahmiból származó jel az írásrendszerekben
nyolc Kana_Voicing Hangos kana jelek Hangos jelek kana - dakuten és handakuten
9 Virama Virama A Virama egy brahmiból származó jel az írásrendszerekben
10-199 Ccc10–Ccc199 Kanonikus kombinálhatósági osztályok 10-199 Fix pozíciós osztályok
200 Mellékelt_Alul_Bal Kapcsolattartó jel balra lent
202 Alább csatolva Kapcsolatfelvétel lent
204
208
210
212
214 Attached_Above Kapcsolattartó jel felülről
216 Mellékelve_jobbra_felül Kapcsolattartó jel a jobb felső sarokban
218 Below_Left Jelzés bal alsó
220 Lent jel alulról
222 Below_Right Jobb alsó jel
224 Bal Jelölje be a bal oldalon
226 Jobb Helyes jel
228 Above_Left Bal felső jel
230 Felett jel felülről
232 Fent_Right Jobb felső jel
233 Double_Below alatta kettős jel
234 Double_Above kettős jel a tetején
240 Iota_Subscript Interlineáris iota Csak görög alsó index

Lásd még

Jegyzetek

  1. Hogyan működik a Zalgo szöveg? . verem túlcsordulás . Letöltve: 2019. április 11. Az eredetiből archiválva : 2019. május 27.
  2. Unicode szabvány 44. számú melléklete – Osztályértékek kanonikus kombinálása . Letöltve: 2019. június 6. Az eredetiből archiválva : 2019. június 8.

Linkek