Repülőgép (Unicode)
Az Unicode szabványban egy sík 65 536 ( 216 ) kódpontból álló összefüggő tartomány . 17 sík található, 0-tól 16-ig számozva, amelyek megfelelnek az első két hexadecimális számjegy lehetséges értékeinek 00-10 16 a hatjegyű kódpozíciószám-formátumban (U+ hh hhhh ). Az utolsó Unicode kódpont a 16. sík utolsó kódpontja, U+10FFFF. A 0-s síkot Basic Multilingual Plane-nak ( BMP ) nevezik, és a leggyakrabban használt karaktereket tartalmazza. A fennmaradó síkokat (1-16) "kiegészítőnek" [1] nevezzük . A Unicode 14.0-s verziója hét síkon használ kódpontokat, amelyek közül kettő magánhasználatra szolgál.
A 17 sík korlátozása az UTF-16 kódolásnak köszönhető, amelyben 220 ( 1048576 ) kódpozíció (16 sík) és a BMP [2] kódolható . Az UTF-8 kódolást sokkal nagyobb, 2 31 ( 2 147 483 648 ) kódpontos ( 32 768 sík ) limittel tervezték, és 2 21 ( 2 097 152 ) kódpontot (32 síkot) tudott használni 4-es korlát mellett is. bájtok [3 ] .
Unicode síkok:
- 0. sík (0000-FFFF): Alap többnyelvű sík ( BMP )
- 1. sík (10000-1FFFF): Kiegészítő többnyelvű sík ( SMP )
- 2. sík ( 20000-2FFFF): Kiegészítő ideográfiai sík (SIP )
- 3. sík ( 30000-3FFFF): harmadlagos ideográfiai sík (TIP )
- A 4-13-as síkok (40000-DFFFF) nem használtak
- 14. sík (E0000 – EFFFF): Kiegészítő speciális célú repülőgép ( SSP )
- Plane 15 ( F0000-FFFFF) Kiegészítő magánhasználati terület-A, SPUA - A
- 16-os repülőgép (100000-10FFFF) Kiegészítő magánhasználati terület-B ( SPUA - B )
Alap többnyelvű sík
A Plane 0 ( Basic Multilingual Plane , BMP ) a legtöbb modern szkript karaktereinek és számos speciális karakternek van fenntartva . A táblázat nagy részét a KJK ideogrammák és a koreai szótagok foglalják el .
A Unicode 14.0-ban a következő blokkok jelennek meg ezen a síkon:
|
- OCR (2440-245F)
- Bekeretezett betűk és számok (2460-24FF)
- Pseudo Graphics (2500-257F)
- Blokkelemek (2580-259F)
- Geometriai formák (25A0-25FF)
- Vegyes karakterek (2600-26FF)
- Dingbats (2700–27BF)
- Vegyes matematikai szimbólumok – A (27C0-27EF)
- További leosztások – A (27F0-27FF)
- Braille (2800-28FF)
- További leosztások – B (2900-297F)
- Vegyes matematikai szimbólumok – B (2980-29FF)
- További matematikai operátorok (2A00-2AFF)
- Különféle szimbólumok és nyilak (2B00–2BFF)
- Glagolita (2C00-2C5F)
- Latin kiterjesztett – C (2C60-2C7F)
- Kopt írás (2C80–2CFF)
- Kiegészítés a grúz betűhöz (2D00-2D2F)
- Ősi líbiai írás (2D30–2D7F)
- Etióp kiterjesztett (2D80-2DDF)
- Kiterjesztett cirill – A (2DE0–2DFF)
- További írásjelek (2E00-2E7F)
- Kiegészítés a KKJ kulcsaihoz (2E80-2EFF)
- Kangxi kulcsai (2F00-2FDF)
- Ideográfiai magyarázó karakterek (2FF0-2FFF)
- Szimbólumok és írásjelek CJK (3000-303F)
- Hiragana (3040-309F)
- Katakana (30A0–30FF)
- Zhuyin fuhao (3100-312F)
- Kompatibilis hangul elemek (3130-318F)
- Kambun (3190-319F)
- Kiterjesztett zhuyin fuhao (31A0-31BF)
- A KKJ (31C0-31EF) jellemzői
- Katakana fonetikai kiterjesztések (31F0-31FF)
- Bekeretezett betűk és hónapok KJK (3200-32FF)
- Kompatibilis elemek CJK (3300-33FF)
- CJK egységes ideogrammok – A kiterjesztés (3400-4DBF)
- A Változások Könyvének hexagramjai (4DC0–4DFF)
- A CJK egységes ideogramjai (4E00-9FFF)
- Szótag és (A000-A48F)
- Letter gombok és (A490-A4CF)
- Lisu (A4D0–A4FF)
- Vai (A500–A63F)
- Kiterjesztett cirill – B (A640–A69F)
- Bamum (A6A0–A6FF)
- Hangszínváltó szimbólumok (A700-A71F)
- Latin kiterjesztett – D (A720-A7FF)
- Sylhet Nagari (A800–A82F)
- Általános indiai számok (A830-A83F )
- Mongol négyzet írás (A840–A87F)
- Saurashtra (A880–A8DF)
- Devanagari Extended (A8E0–A8FF)
- Kaya-li (A900–A92F)
- Rejang (A930–A95F)
- Kiterjesztett hangul elemek – A (A960–A97F)
- jávai (A980–A9DF)
- Burmai kiterjesztett – B (A9E0-A9FF)
- Cham szkript (AA00-AA5F)
- burmai kiterjesztett – A (AA60-AA7F)
- thai viet (AA80-AADF)
- Manipuri bővítmények (AAE0-AAFF)
- Etióp kiterjesztett – A (AB00-AB2F)
- Latin kiterjesztett – E (AB30-AB6F)
- Cherokee-kiegészítő (AB70–ABBF)
- Manipuri (ABC0–ABFF)
- hangul szótag (AC00–D7AF)
- Kiterjesztett hangul elemek – B (D7B0–D7BF)
- A helyettesítő párok felső része (D800-DB7F)
- Legnépszerűbb helyettesítő párok magánhasználatra (DB80-DBFF)
- A helyettesítő párok alsó része (DC00-DFFF)
- Magánhasználati terület (E000-F8FF)
- Kompatibilis CJK-ideogramok (F900-FAFF)
- Alfabetikus bemutató űrlapok (FB00-FB4F)
- Arab űrlapok – A (FB50-FDCF, FDF0-FDFF)
- Változatválasztók (FE00-FE0F)
- Függőleges űrlapok (FE10–FE1F)
- Kombinált félkarakterek (FE20-FE2F)
- Kompatibilis CJC űrlapok (FE30-FE4F)
- Kis változatú formák (FE50-FE6F)
- Arab formák – B (FE70-FEFF)
- Fél- és teljes szélességű űrlapok (FF00-FFEF)
- Speciális karakterek (FFF0-FFFF)
|
További többnyelvű sík
Az 1. sík (Supplementary Multilingual Plane, eng. Supplementary Multilingual Plane , SMP ) elsősorban történetírásra van fenntartva, de magában foglalja a hagyományos szimbólumokat is, például zenei és matematikai szimbólumokat.
A Unicode 14.0-ban a következő karakterkészletek jelennek meg ezen a síkon:
További ideográfiai sík
A 2. sík (Supplementary Ideographic Plane, eng. Supplementary Ideographic Plane , SIP ) a ritkán használt KKJ hieroglifák számára van fenntartva .
A Unicode 14.0-ban a következő karakterkészletek jelennek meg ezen a síkon:
Harmadlagos ideográfiai sík
A 3. sík ( Tertiary Ideographic Plane , TIP ) ritkán használt kínai karaktereket tartalmaz , és állítólag a kínai írás történeti formáit is tartalmazza
.
A harmadlagos ideográfiai sík a következő tartományokra oszlik [4] :
- Egységes CJK ideogrammok - G kiterjesztés (30000-3134F) - további ritkán használt kínai ideogramok;
- Zhuanshu (31400-342FF) - hieroglifák a "kis pecsét" (xiaozhuan, 小篆) és a "nagy pecsét" (dazhuan, 大篆) stílusában [5] [4] ;
- A Jiaguwen (34400-35BFF) a Shang-korszak legrégebbi kínai karakterei ( jiaguwen , 甲骨文), kagylók, koponyák és állatcsontok jósló felirataiban találhatók [6] [4]
A jövőben várhatóan szerepelnek benne Shang és Zhou karakterek ( jinwen , 金文 ), amelyek bronzedényeken és hangszereken található rituális feliratokban találhatók, valamint a Hadakozó Államok időszakának karakterkészletei [4] .
Speciális kiegészítő sík
14. sík (Specialized Additional plane, eng. Supplementary Special-purpose Plane , SSP ) a speciális célra használt karakterek számára fenntartva.
A Unicode 14.0-ban a következő blokkok jelennek meg ezen a síkon:
- Címkék (E0000—E007F)
- Változatválasztók melléklete (E0100-E01EF)
Magánhasználatú területek
Egyes Unicode-tartományok privát használatra és kísérletezésre vannak fenntartva. Ezek tartalmazzák:
- Privát terület az alap többnyelvű síkon (E000-F8FF)
- További 15-ös (F0000-U+FFFFF) és 16-os (100000-10FFFF) gépek
Lásd még
Jegyzetek
- ↑ Unicode Consortium Glossary – Kiegészítő síkok . Letöltve: 2018. szeptember 30. Az eredetiből archiválva : 2018. szeptember 24.. (határozatlan)
- ↑ Lásd az Unicode szabvány 3.5 „UTF-16 bites elosztása” táblázatát https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archiválva : 2019. március 31. a Wayback Machine -nél
- ↑ Lásd az Unicode szabvány 3.6 „UTF-8 biteloszlása” táblázatát https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archiválva : 2019. március 31. a Wayback Machine -nél
- ↑ 1 2 3 4 Útiterv a TIPPhez ( PDF) (2020. március 12.). Letöltve: 2020. március 17. Az eredetiből archiválva : 2020. február 29.
- ↑ Javaslat a Small Seal Script UCS (angol nyelvű) kódolására (PDF) (2019. június 20.). Letöltve: 2020. március 17. Az eredetiből archiválva : 2019. november 30.
- ↑ Véleménykérés az Oracle Bone Script ( PDF) kódolásához (2015. október 21.). Letöltve: 2017. november 20. Az eredetiből archiválva : 2019. június 14.
Linkek
Unicode blokkok _ _ |
---|
Alapszintű többnyelvű sík (0. sík, BMP) [U+0000…U+FFFF] |
---|
|
|
|
További ideográfiai sík (2. sík, SIP) [U+20000…U+2FFFF] |
---|
|
|
Harmadlagos ideográfiai sík (3. sík, TIP) [U+30000…U+3FFFF] |
---|
- CJK Egységes Ideogramok – G kiterjesztés
|
|
4-13 síkok [U+40000…U+DFFFF] |
---|
Nem érintett |
|
Speciális kiegészítő repülőgép (14-es sík, SSP) [U+E0000…U+EFFFF] |
---|
- Címkék
- Kiegészítő változatválasztók
|
|
Magánhasználatú területek (15-ös és 16-os repülőgép, PUA) [U+F0000…U+10FFFF] |
---|
|
|