Az IRI ( Internationalized Resource Identifier ) egy nemzetköziesített erőforrás-azonosító . Az angolban az "IRI" kiejtése /aɪɑraɪ/ , az oroszban néha [ iri ]. Az IRI egy rövid karaktersorozat, amely egy absztrakt vagy fizikai erőforrást azonosít a világ bármely nyelvén. Az IRI-k célja az URI -k helyettesítése a jövőben .
Az IRI egy karakterlánc , amely lehetővé teszi bármely erőforrás azonosítását: dokumentum , kép, fájl , szolgáltatás, e- mail fiók stb. Először is természetesen az internet és a világháló erőforrásairól beszélünk . Az IRI-ket az egységes erőforrás-azonosító ( URI ) helyettesítésére hozták létre, hogy elkerüljék a karakterkorlátozásaikat: az URI-k csak latin karaktereket és az US- ASCII karakterkészletből származó írásjeleket tartalmazhatnak (összesen körülbelül 60 karakter). Ennek eredményeként, ha cirill karaktereket , hieroglifákat vagy mondjuk konkrét francia és eszperantó karaktereket akarunk használni az URI -ban, akkor az URI -t ugyanúgy kell kódolnunk, ahogy a Wikipédia Unicode karakterekkel kódolja az URL-eket . Például egy olyan sor, mint:
http://ru.wikipedia.org/wiki/cirillaz URL-ben a következőképpen van kódolva:
http://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B0Lásd az URL -t a kódolás részleteiért . Ennek eredményeként az alapvető latin
alapú nyelvek kivételével az összes URI-k elvesztik emberi olvashatóságukat . Ez ellentétes az internacionalizmus elvével , amelyet az Internet összes vezető szervezete hirdetett, beleértve a W3C -t és az ISOC -t is . Az IRI-ket kifejezetten ennek a problémának a megoldására tervezték. Az IRI-k bármilyen Unicode (Unicode/ ISO 10646) karaktert tartalmazhatnak tiszta formában, kódolás nélkül. Az IRI-k nem sértik más nyelvek jogait, és magasabb fokú egyenlőséghez vezetnek az internetezők számára.
Egyébként az IRI-k szinte azonosak az eddigi URI-kkel. Lehetőség van egyszerű konverzióra ( angol leképezés ) az URI-k és az IRI-k között.
Az IRI fejlesztése 2001 novembere körül kezdődött a World Wide Web Consortiumnál . A specifikáció első változata 2002 áprilisában jelent meg . A szabványt 2005 januárjában az RFC 3987 szabványban formalizálták . A World Wide Web Consortium nemzetköziesítési munkacsoportjában folyamatban van az IRI specifikációval kapcsolatos munka.
Jelenleg az IRI-t a következő technológiákban használják:
Javasoljuk az Unicode ( UTF-8 formátumú ) használatát a DNS Domain Name Systemben, amely egy Punycode rendszer
Egy cím egyedi azonosításához, például egy hivatkozásban, speciális módszereket kell alkalmaznia - például további tervezést kell alkalmazni az azonos stílusú karakterekhez (például A, B, E, K, M, H karakterek , O, P, C, T, X cirill és latin ) - különböző betűtípusok, színek stb., vagy például az „example.com” domain tulajdonosa kénytelen lesz megvásárolni minden olyan domaint, amely ilyen karaktereket tartalmaz bármilyen kombináció, amely ebben az esetben több: két „e”, „x”, „a” és „p”, annak érdekében, hogy elkerüljük a behatolók tevékenységét, akik ilyen „vegyes” tartományt jelölhetnek ki a az „example.com” domain tulajdonosa, és űrlapokon keresztül bizalmas információkat kaphat a látogatóktól.
Szükség lesz a kívánt domain regisztrálására is a világ összes nyelvén, részben ugyanezen okok miatt. A védjegyek esetében a probléma jogi úton is megoldható, de az olyan oldalakkal, mint az "a.com" és az "a.com" más a helyzet. Nehéz lesz magának a látogatónak megbirkóznia az ilyen címekkel, ha például valakinek a honlapja . Ez vonatkozik az olyan címekre is, mint a "dom.ru" és a "dom.ru".
Néhány[ ki? ] úgy vélik, hogy a domain név latin karakterekre való korlátozása ugyanolyan természetes, mint a programozási nyelvek operátorai számára. A fájl- és szekciónevek problémáját a böngészők is sikeresen megoldhatják: például az Opera 8.5 és a Firefox 3.0 ilyen módon jeleníti meg a " http://ru.wikipedia.org/wiki/Кириллица" címet, csak azért kódolva, hogy kérést küldjön a szervernek .