Repülőgép (Unicode)

Az Unicode szabványban egy sík 65 536 ( 216 )  kódpontból álló összefüggő tartomány . 17 sík található, 0-tól 16-ig számozva, amelyek megfelelnek az első két hexadecimális számjegy lehetséges értékeinek 00-10 16 a hatjegyű kódpozíciószám-formátumban (U+ hh hhhh ). Az utolsó Unicode kódpont a 16. sík utolsó kódpontja, U+10FFFF. A 0-s síkot Basic Multilingual Plane-nak ( BMP ) nevezik, és a  leggyakrabban használt karaktereket tartalmazza. A fennmaradó síkokat (1-16) "kiegészítőnek" [1] nevezzük . A Unicode 14.0-s verziója hét síkon használ kódpontokat, amelyek közül kettő magánhasználatra szolgál.

A 17 sík korlátozása az UTF-16 kódolásnak köszönhető, amelyben 220 ( 1048576 ) kódpozíció (16 sík) és a BMP [2] kódolható . Az UTF-8 kódolást sokkal nagyobb, 2 31 ( 2 147 483 648 ) kódpontos ( 32 768 sík ) limittel tervezték, és 2 21 ( 2 097 152 ) kódpontot (32 síkot) tudott használni 4-es korlát mellett is. bájtok [3 ] .

Unicode síkok:

Alap többnyelvű sík

A Plane 0 ( Basic Multilingual Plane , BMP ) a legtöbb modern szkript karaktereinek és számos speciális karakternek van fenntartva .  A táblázat nagy részét a KJK ideogrammák és a koreai szótagok foglalják el .

A Unicode 14.0-ban a következő blokkok jelennek meg ezen a síkon:

  • OCR (2440-245F)
  • Bekeretezett betűk és számok (2460-24FF)
  • Pseudo Graphics (2500-257F)
  • Blokkelemek (2580-259F)
  • Geometriai formák (25A0-25FF)
  • Vegyes karakterek (2600-26FF)
  • Dingbats (2700–27BF)
  • Vegyes matematikai szimbólumok – A (27C0-27EF)
  • További leosztások – A (27F0-27FF)
  • Braille (2800-28FF)
  • További leosztások – B (2900-297F)
  • Vegyes matematikai szimbólumok – B (2980-29FF)
  • További matematikai operátorok (2A00-2AFF)
  • Különféle szimbólumok és nyilak (2B00–2BFF)
  • Glagolita (2C00-2C5F)
  • Latin kiterjesztett – C (2C60-2C7F)
  • Kopt írás (2C80–2CFF)
  • Kiegészítés a grúz betűhöz (2D00-2D2F)
  • Ősi líbiai írás (2D30–2D7F)
  • Etióp kiterjesztett (2D80-2DDF)
  • Kiterjesztett cirill – A (2DE0–2DFF)
  • További írásjelek (2E00-2E7F)
  • Kiegészítés a KKJ kulcsaihoz (2E80-2EFF)
  • Kangxi kulcsai (2F00-2FDF)
  • Ideográfiai magyarázó karakterek (2FF0-2FFF)
  • Szimbólumok és írásjelek CJK (3000-303F)
  • Hiragana (3040-309F)
  • Katakana (30A0–30FF)
  • Zhuyin fuhao (3100-312F)
  • Kompatibilis hangul elemek (3130-318F)
  • Kambun (3190-319F)
  • Kiterjesztett zhuyin fuhao (31A0-31BF)
  • A KKJ (31C0-31EF) jellemzői
  • Katakana fonetikai kiterjesztések (31F0-31FF)
  • Bekeretezett betűk és hónapok KJK (3200-32FF)
  • Kompatibilis elemek CJK (3300-33FF)
  • CJK egységes ideogrammok – A kiterjesztés (3400-4DBF)
  • A Változások Könyvének hexagramjai (4DC0–4DFF)
  • A CJK egységes ideogramjai (4E00-9FFF)
  • Szótag és (A000-A48F)
  • Letter gombok és (A490-A4CF)
  • Lisu (A4D0–A4FF)
  • Vai (A500–A63F)
  • Kiterjesztett cirill – B (A640–A69F)
  • Bamum (A6A0–A6FF)
  • Hangszínváltó szimbólumok (A700-A71F)
  • Latin kiterjesztett – D (A720-A7FF)
  • Sylhet Nagari (A800–A82F)
  • Általános indiai számok (A830-A83F )
  • Mongol négyzet írás (A840–A87F)
  • Saurashtra (A880–A8DF)
  • Devanagari Extended (A8E0–A8FF)
  • Kaya-li (A900–A92F)
  • Rejang (A930–A95F)
  • Kiterjesztett hangul elemek – A (A960–A97F)
  • jávai (A980–A9DF)
  • Burmai kiterjesztett – B (A9E0-A9FF)
  • Cham szkript (AA00-AA5F)
  • burmai kiterjesztett – A (AA60-AA7F)
  • thai viet (AA80-AADF)
  • Manipuri bővítmények (AAE0-AAFF)
  • Etióp kiterjesztett – A (AB00-AB2F)
  • Latin kiterjesztett – E (AB30-AB6F)
  • Cherokee-kiegészítő (AB70–ABBF)
  • Manipuri (ABC0–ABFF)
  • hangul szótag (AC00–D7AF)
  • Kiterjesztett hangul elemek – B (D7B0–D7BF)
  • A helyettesítő párok felső része (D800-DB7F)
  • Legnépszerűbb helyettesítő párok magánhasználatra (DB80-DBFF)
  • A helyettesítő párok alsó része (DC00-DFFF)
  • Magánhasználati terület (E000-F8FF)
  • Kompatibilis CJK-ideogramok (F900-FAFF)
  • Alfabetikus bemutató űrlapok (FB00-FB4F)
  • Arab űrlapok – A (FB50-FDCF, FDF0-FDFF)
  • Változatválasztók (FE00-FE0F)
  • Függőleges űrlapok (FE10–FE1F)
  • Kombinált félkarakterek (FE20-FE2F)
  • Kompatibilis CJC űrlapok (FE30-FE4F)
  • Kis változatú formák (FE50-FE6F)
  • Arab formák – B (FE70-FEFF)
  • Fél- és teljes szélességű űrlapok (FF00-FFEF)
  • Speciális karakterek (FFF0-FFFF)

További többnyelvű sík

Az 1. sík (Supplementary Multilingual Plane, eng.  Supplementary Multilingual Plane , SMP ) elsősorban történetírásra van fenntartva, de magában foglalja a hagyományos szimbólumokat is, például zenei és matematikai szimbólumokat.

A Unicode 14.0-ban a következő karakterkészletek jelennek meg ezen a síkon:

  • Lineáris B szótagok (10000-1007F)
  • Lineáris B ideogrammok (10080-100FF)
  • Égei-tengeri számok (10100-1013F)
  • Ókori görög számok (10140-1018F)
  • Ősi szimbólumok (10190-101CF)
  • Phaistos lemez (101D0-101FF)
  • líciai írás (10280-1029F)
  • Carian (102A0–102DF)
  • Kopt epact számok (102E0-102FF)
  • Régi dőlt ( 10300-1032F )
  • Gótikus írás (10330-1034F)
  • Régi perm írás (10350-1037F)
  • ugariti írás (10380-1039F)
  • Régi perzsa írás (103A0-103DF)
  • Deseret Letter (10400-1044F)
  • Shaw ábécé (10450-1047F)
  • szomáliai írás (10480-104AF)
  • Osage (104B0–104FF)
  • Elbasan script (10500-1052F)
  • Agvan script (10530-1056F)
  • Vitkut levél (10570-105BF)
  • Lineáris A (10600-1077F)
  • Latin kiterjesztett – F (10780-107BF)
  • ciprusi írás (10800-1083F)
  • arámi császári (10840-1085F)
  • Palmyrene levél (10860-1087F)
  • Nabateus levél (10880-108AF)
  • Hatran (108E0–108FF)
  • föníciai írás (10900-1091F)
  • líd írás (10920-1093F)
  • Meroita hieroglifák (10980-1099F)
  • Meroitic kurzív (109A0-109FF)
  • Kharosthi (10A00–10A5F)
  • Ősi dél-arábiai írás (10A60–10A7F)
  • Ősi észak-arábiai írás (10A80-109FF)
  • manicheus írás (10AC0–10AFF)
  • Aveszta írás (10B00–10B3F)
  • Pártus epigráfiai írás (10B40-10B5F)
  • Pahlavi epigráfiai írás (10B60-10B7F)
  • Pahlavi Zsoltár ( 10B80-10BAF )
  • Régi török ​​rovásírás (10C00-10C4F)
  • magyar rúnák (10C00-10C4F)
  • Hanifi (10D00–10D3F)
  • Rumi számok (10E60-10E7F)
  • Yezidi szkript (10E80–10EBF)
  • Régi szogd írás (10F00–10F2F)
  • szogd írás (10F30–10F6F)
  • Régi ujgur szkript (10F70–10FAF)
  • Khwarezmian írás (10FB0–10FBF)
  • Elimaic betű (10FE0-10FFF)
  • Brahmi (11000-1107F)
  • Kaithi (11080-110CF)
  • Sorang sompeng (110D0–110FF)
  • Chakma (11100-1114F)
  • Mahajani (11150-1117F)
  • Charade (11180-111DF)
  • Szingaléz archaikus számok (111E0-111FF)
  • Hojiki (11200-1124F)
  • Multani (11280-112AF)
  • Khudabadi (112B0–112FF)
  • Grantha (11300-1137F)
  • Neva (11400-1147F)
  • Tirhuta (11480-114DF)
  • Siddhamatrika (11580-115FF)
  • Modi (11600-1165F)
  • Kiegészítés az ómongol íráshoz (11660-1167F)
  • Takri (11680-116CF)
  • Ahom (11700-1174F)
  • Dogra (11800-1184F)
  • Varang-kshiti (118A0-118FF)
  • Dives akuru (11900-1195F)
  • Nandinagari (119A0-119FF)
  • Zanabazar Square Script (11A00–11A4F)
  • Soyombo (11A50–11AAF)
  • Kiterjesztett kanadai szótag – A (11AB0-11ABF)
  • Po Chin Ho (11AC0–11AFF)
  • Bhaikshukas (11C00-11C6F)
  • Marchen (11C70–11CBF)
  • Gondi Masarama (11D00–11D5F)
  • Gunjal Gondi (11D60–11DAF)
  • Makassar forgatókönyv (11EE0–11EFF)
  • Fox-kiegészítő (11FB0–11FBF)
  • Tamil kiegészítés (11FC0-11FFF)
  • Ékírás (12000-123FF)
  • Ékírásos számok és írásjelek (12400-1247F)
  • Kora dinasztikus ékírás (12480-1254F)
  • Cypro-Minoan script (12F90-12FFF)
  • Egyiptomi hieroglifák (13000-1342F)
  • Egyiptomi hieroglif formázási vezérlőkarakterek (13430-1343F)
  • Anatóliai hieroglifák (14400-1467F)
  • Bamum kiegészítés (16800-16A3F)
  • Mro (16A40–16A6F)
  • Tangsa (16A70–16ACF)
  • Basszus (16AD0-16AFF)
  • Pahau (16B00–16B8F)
  • Medefidrin (16E40-16E9F)
  • Miao (16FE0–16FFF)
  • Ideográfiai karakterek és írásjelek (16F00-16F9F)
  • Tangut forgatókönyv (17000-187FF)
  • A Tangut-írás elemei (18800-18AFF)
  • Kis khitan szkript (18B00–18CFF)
  • Kiegészítés a Tangut szkripthez (18D00-18D8F)
  • Kiterjesztett kana – B (1AFF0–1AFFF)
  • Kana- kiegészítés (1B000-180FF)
  • Kiterjesztett kana – A (1B100–1B12F)
  • Kisebb kana-kiterjesztés (1B130–1B16F)
  • Nu Shu (Unicode blokk) (1B170–1B2FF)
  • Duploier gyorsírás (1BC00-18C9F)
  • Gyorsított formázási karakterek (1BCA0-1BCAF)
  • Znamenny kotta (1CF00-1CFCF)
  • Bizánci zenei szimbólumok (1D000-1D0FF)
  • Zenei szimbólumok (1D100–1D1FF)
  • Ókori görög jelölés (1D200–1D24F)
  • Maja számok (1D2E0–1D2FF)
  • A "Nagy Titok kánonjának" szimbólumai (1D300-1D35F)
  • Számolópálcák száma (1D360-1D37F)
  • Matematikai betűk és számok (1D400-1D7FF)
  • Jelírás (1D800-1DAAF)
  • Latin kiterjesztett – G (1DF00-1DFFF)
  • Glagolita-kiegészítő (1E000–1E02F)
  • Nyekeng Puecim Hmong (1E100–1E14F)
  • Toto (1E290–1E2BF)
  • Wancho (1E2C0–1E2FF)
  • Etióp kiterjesztett – B (1E7E0–1E7FF)
  • Kikakui (1E800–1E8DF)
  • Adlam (1E900–1E95F)
  • Siyak indiai számok (1EC70–1ECBF)
  • Oszmán szijak számok (1ED00–1ED4F)
  • Arab matematikai ábécé szimbólumai (1EE00-1EEFF)
  • Mahjong kocka (1F000–1F02F)
  • Dominó csontok (1F030–1F09F)
  • Kártyajáték ( 1F0A0–1F0FF )
  • Bekeretezett betűk és számok kiegészítése (1F100-1F1FF)
  • Keretes ideográfiai karakter- kiegészítés (1F200–1F2FF)
  • Különféle szimbólumok és piktogramok (1F300-1F5FF)
  • Hangulatjelek (1F600–1F64F)
  • Díszkarakterek (1F650-1F67F)
  • Szállítási és térképszimbólumok (1F680-1F6FF)
  • Alkímiai szimbólumok (1F700-1F77F)
  • Kiterjesztett geometriai alakzatok (1F780-1F7FF)
  • További leosztások – C (1F800-1F8FF)
  • További szimbólumok és piktogramok (1F900-1F9FF)
  • Sakk szimbólumok (1FA00-1FA6F)
  • Kibővített szimbólumok és piktogramok – A (1FA70-1FAFF)
  • Az örökölt számítástechnikai szimbólumok (1FB00-1FBFF)

További ideográfiai sík

A 2. sík (Supplementary Ideographic Plane, eng.  Supplementary Ideographic Plane , SIP ) a ritkán használt KKJ hieroglifák számára van fenntartva .

A Unicode 14.0-ban a következő karakterkészletek jelennek meg ezen a síkon:

Harmadlagos ideográfiai sík

A 3. sík ( Tertiary Ideographic Plane , TIP ) ritkán használt kínai karaktereket tartalmaz , és állítólag a kínai írás történeti formáit is tartalmazza . 

A harmadlagos ideográfiai sík a következő tartományokra oszlik [4] :

A jövőben várhatóan szerepelnek benne Shang és Zhou karakterek ( jinwen , 金文 ), amelyek bronzedényeken és hangszereken található rituális feliratokban találhatók, valamint a Hadakozó Államok időszakának karakterkészletei [4] .

Speciális kiegészítő sík

14. sík (Specialized Additional plane, eng.  Supplementary Special-purpose Plane , SSP ) a speciális célra használt karakterek számára fenntartva.

A Unicode 14.0-ban a következő blokkok jelennek meg ezen a síkon:

Magánhasználatú területek

Egyes Unicode-tartományok privát használatra és kísérletezésre vannak fenntartva. Ezek tartalmazzák:

Lásd még

Jegyzetek

  1. Unicode Consortium Glossary – Kiegészítő síkok . Letöltve: 2018. szeptember 30. Az eredetiből archiválva : 2018. szeptember 24..
  2. Lásd az Unicode szabvány 3.5 „UTF-16 bites elosztása” táblázatát https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archiválva : 2019. március 31. a Wayback Machine -nél
  3. Lásd az Unicode szabvány 3.6 „UTF-8 biteloszlása” táblázatát https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archiválva : 2019. március 31. a Wayback Machine -nél
  4. 1 2 3 4 Útiterv a TIPPhez  ( PDF) (2020. március 12.). Letöltve: 2020. március 17. Az eredetiből archiválva : 2020. február 29.
  5. ↑ Javaslat a Small Seal Script UCS (angol nyelvű) kódolására  (PDF) (2019. június 20.). Letöltve: 2020. március 17. Az eredetiből archiválva : 2019. november 30.
  6. Véleménykérés az Oracle Bone Script  ( PDF) kódolásához (2015. október 21.). Letöltve: 2017. november 20. Az eredetiből archiválva : 2019. június 14.

Linkek