ISO 8859

Az ISO 8859 ASCII - kompatibilis kódlapok  családja , amelyet az ISO és az IEC közösen fejlesztettek ki . 2006 -ban ez a család 15 kódlapból állt.

Általános információk

Mivel az ISO 8859 kódolásokat kommunikációs eszközként, nem pedig jó minőségű tipográfia biztosítására tervezték, nem tartalmaznak olyan karaktereket, mint a dupla idézőjel , különböző hosszúságú kötőjelek , ligatúrák stb. (bár még mindig vannak ilyen karakterek , nem törő szóköz és lágy kötőjel karakterként). De elég sok hely (0x80-0x9F régió) van fenntartva a "felső vezérlőkaraktereknek ", amelyek a terminálok vezérlésére szolgálnak .

Mivel a különböző ISO 8859 oldalakat közösen fejlesztették ki, van némi kölcsönös kompatibilitásuk. Például a német nyelvben használt hét kiterjesztett latin karakter ugyanazon a helyen van az összes olyan kódlapon, amely ezeket a karaktereket tartalmazza. A Latin-1-Latin-4 oldalak kompatibilitása még nagyobb: ezeken az oldalakon minden karakter azonos pozícióban jelenik meg rajtuk.

Alkalmazás

Az ISO 8859 sorozatú kódolásokat főként Unix -szerű rendszereken, valamint weboldalak kódolására használják (mivel a legtöbb webszerver UNIX-ot használ).

A Microsoft Windows rendszerek Windows-kódolásokat használnak, amelyek közül néhány kompatibilis az ISO 8859-el, de több grafikus karaktert tartalmaznak a 0x80-0x9F régió használatával.

Az ISO 8859 részei

ISO 8859-1 (latin-1) Kiterjesztett latin , beleértve a legtöbb nyugat-európai nyelv karaktereit ( angol , dán , ír , izlandi , spanyol , olasz , német , norvég , portugál , román , feröeri , svéd , skót (gael) és a holland , finn , francia nyelv egy részét ) , valamint néhány kelet-európai ( albán ) és afrikai nyelv ( afrikaans , szuahéli ). A Latin-1-ből hiányzik az eurójel és a nagy Ÿ betű . Ez a kódlap a HTML dokumentumok és e- mail üzenetek alapértelmezett kódolása . Az első 256 Unicode karakter is ennek a kódlapnak felel meg . ISO 8859-2 (latin-2) A latin kiterjesztése a közép-európai és kelet-európai nyelvek karaktereire ( bosnyák , magyar , lengyel , szlovák , szlovén , horvát , cseh ). A Latin-2-ből, akárcsak a Latin-1-ből, hiányzik az eurójel. ISO 8859-3 (latin-3) A latin nyelv kiterjesztése a dél-európai nyelvek ( máltai , török ​​és eszperantó ) karaktereire. ISO 8859-4 (latin-4) A latin kiterjesztése az észak-európai nyelvek karaktereire ( grönlandi , észt , lett , litván és számi nyelvek ). ISO 8859-5 (latin/cirill) Cirill betűkkel , szláv nyelvek karaktereivel ( fehérorosz , bolgár , macedón , orosz , szerb és részben ukrán ). ISO 8859-6 (latin/arab) Az arab nyelvben használt szimbólumok . Más arab nyelvű karakterek nem támogatottak. Az ISO 8859-6 szabvány szerinti szöveg helyes megjelenítéséhez a kétirányú írás és a környezetérzékeny karakterformák támogatása szükséges. ISO 8859-7 (latin/görög) A modern görög szimbólumok . Használható ógörög szövegek monoton helyesírással írásához is. ISO 8859-8 (latin/héber) Modern héber szimbólumok . Két változatban használatos: logikai karaktersorrenddel (kétirányú támogatás szükséges) és vizuális karakterrenddel. ISO 8859-9 (latin-5) Latin-1 változat, amely a ritkán használt izlandi karaktereket török ​​karakterekre cseréli . Török és kurd nyelvre használják . ISO 8859-10 (latin-6) Egy latin-4-es változat, amely kényelmesebb a skandináv nyelvekhez . ISO 8859-11 (latin/thai) Thai nyelvi szimbólumok . ISO 8859-12 (latin/dévanagari) Devanagari script szimbólumok . 1997- ben az ISO 8859-12 szabványon végzett munka hivatalosan leállt, és ezt a kódolást soha nem fogadták el szabványként. ISO 8859-13 (latin-7) Egy latin-4-es változat, amely kényelmesebb a balti nyelvek számára . ISO 8859-14 (latin-8) Kibővített latin, hogy magában foglalja a kelta nyelvek karaktereit , például a skót (gael) és a breton karaktereket . ISO 8859-15 (latin-9) Latin-1 változat, amely a ritkán használt karaktereket a finn , francia és észt teljes támogatásához szükséges karakterekkel helyettesíti . Ezenkívül a Latin-9-hez hozzáadták az eurójelet. ISO 8859-16 (latin-10) Kibővítette a latin nyelvet a dél- és kelet-európai ( albán , magyar , olasz , lengyel , román , szlovén , horvát ), valamint néhány nyugat-európai nyelv ( az új helyesírásban ír , német , finn , francia ) karakterekkel. A Latin-9-hez hasonlóan a Latin-10-hez is hozzáadták az eurójelet.