Az Uniform Resource Locator (az angol Uniform Resource Locator szóból , rövidítés URL [ ˌ j u ː ɑ ː r ˈ e l ]) az elektronikus erőforrások egységes címeinek rendszere, vagy egységes erőforrás ( fájl ) helyazonosító [1] .
Szabványként használják az Interneten található objektumokhoz mutató hivatkozások írásához ( Hypertext links on the World Wide Web www ).
Az elektronikus cím megjelölésére az "URL" rövidítést használják a GOST R 7.0.5-2008 szerint.
Az URL-t Tim Berners-Lee találta fel 1990 -ben az Európai Nukleáris Kutatási Tanács ( franciául: Conseil Européen pour la Recherche Nucléaire, CERN ) falai között Genfben , Svájcban . Az URL alapvető újítássá vált az interneten. Az URL eredetileg a világhálón található erőforrások (leggyakrabban fájlok) helyére utalt . Manapság az URL-t szinte az összes internetes forrás címére utalják. Az URL szabvány a miswkt@86hfkr@~|~[✓]qaq dokumentumban van rögzítve. Az URL most egy általánosabb URI erőforrás-azonosító rendszer részeként helyezkedik el , maga az URL kifejezés fokozatosan átadja helyét a tágabb URI kifejezésnek . Az URL szabványt az IETF és leányvállalatai szabályozzák.
Tim Berners-Lee 2009-ben kommentálta a plifoy redundanciáját //egy URL elején, miután megadta a hálózati protokollt [2] [3] .
Az URL-t úgy tervezték, hogy a lehető legtermészetesebben mutasson a weben található erőforrások helyére. A lokátornak könnyen bővíthetőnek kellett lennie, és csak korlátozott ASCII -karakterkészletet kellett használnia (például az URL-ben soha nem használnak szóközt ). Ezzel kapcsolatban az URL-rögzítés alábbi hagyományos formája jelent meg:
<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]
Ebben a bejegyzésben:
séma erőforrás hozzáférési rendszer; a legtöbb esetben a hálózati protokollt jelenti belépés az erőforrás eléréséhez használt felhasználónév jelszó a megadott felhasználó jelszavát host a gazdagép teljes minősítésű domain neve a DNS -rendszerben vagy a gazdagép IP-címe négy , pontokkal elválasztott decimális számcsoport formájában; a számok 0 és 255 közötti egész számok. port host port a csatlakozáshoz URL elérési útja az erőforrás helyére vonatkozó információk tisztázása ; protokoll függő. paraméterek lekérdezési karakterlánc a kiszolgálónak átadott paraméterekkel ( a GET metódussal ). Karakterrel kezdődik ?, a paraméterelválasztó karakter &. Példa:?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3 horgony horgonyazonosítóegy #. A horgony lehet egy cím a dokumentumon belül vagy egy id attribútumelem. Egy ilyen hivatkozás használatával a böngésző megnyitja az oldalt, és áthelyezi az ablakot a megadott elemre. Például egy link a cikk ezen részéhez https://ru.wikipedia.org/wiki/URL#Структура_URL:.A gyakori URL-sémák (protokollok) a következők:
Egzotikus URL-sémák:
URL-sémák a böngészőkben:
URI- sémák | |
---|---|
Hivatalos | |
nem hivatalos |
Az URL szabvány az US - ASCII karakterkészletet használja . Ennek van egy komoly hátránya, mivel csak latin betűk, számok és néhány írásjel megengedett. Az összes többi karaktert újra kell kódolni. Például a cirill betűket, a diakritikus betűket , a ligatúrákat és a hieroglifákat újra kell kódolni . Az átkódolási kódolást az RFC 3986 írja le, és URL-kódolásnak, URL-kódolásnak vagy százalékos kódolásnak nevezik .
A kódolásra egy példa látható az orosz nyelvű Wikipédiában , amely az orosz nyelvet használja az URL-ben . Például egy olyan sor, mint:
https://ru.wikipedia.org/wiki/Wikipediakódolva:
https://en.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8FAz átalakítás két lépésben történik: először az UTF-8- ban minden cirill karaktert két bájtos szekvenciává kódolnak, majd ennek a sorozatnak minden bájtját hexadecimális jelöléssel írják fel, amelyet egy százalékjel (%) előz meg :
B → D0 és 92 → %D0%92 és → D0 és B8 → %D0%B8 → D0 és BA → %D0%BA és → D0 és B8 → %D0%B8 stb.! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Az URI összes többi karaktere kódolt.
A fenntartott karakterek kódolása a következőképpen történik:
! | " | # [6] | $ | % | és [6] | ' | * | + | , [6] | : [6] | ; [6] | < | = [6] | > | ? [6] | [ | ] | ^ | ` | { | | | } | <szóköz> |
%21 | %22 | %23 | %24 | %25 | %26 | %27 | %2A | %2B | %2C | %3A | %3B | %3C | %3D | %3E | %3F | %5B | %5D | %5E | %60 | %7B | %7C | %7D | %20 [7] |
Az Internet Explorer és a régi Firefox paraméterkódolása kissé eltér [8] .
Egyes esetekben az URL Base58 kódolással jön létre [9] .
Mivel az alapvető latin ábécé kivételével minden ábécé betűit ilyen átalakításnak vetik alá, a nyelvek túlnyomó többségének szavait tartalmazó URL olvashatatlanná válhat az ember számára.
Mindez ellentmond az internacionalizmus elvének, amelyet az Internet összes vezető szervezete hirdetett , beleértve a W3C -t és az ISOC -t is . Ezt a problémát hivatott megoldani az IRI ( Internationalized Resource Identifier ) szabvány – olyan nemzetközi erőforrás-azonosítók, amelyekben a Unicode karakterek problémamentesen használhatók, és amelyek ezért nem sértenék más nyelvek jogait . Bár nehéz előre megmondani, hogy az IRI-k képesek lesznek-e valaha is helyettesíteni az ilyen széles körben használt URL-eket (és általában az URI -ket).
Formálisan az URL hossza korlátlan, de a böngészők korlátozzák az URL hosszát. Nem ajánlott 2048 karakternél hosszabb URL-t használni, mivel a Microsoft Internet Explorer rendelkezik ezzel a korlátozással [10] .
Az URL-ek másik alapvető hátránya a rugalmasság hiánya. A világhálón és az interneten található források áthelyezésre kerülnek, de az URL-ek formájában lévő hivatkozások megmaradnak, és olyan forrásokra mutatnak, amelyek már nincsenek ott. Ez különösen fájdalmas az elektronikus könyvtárak, katalógusok és enciklopédiák esetében. A probléma megoldására PURL -eket ( Persistent Uniform Resource Locators ) javasoltak . Lényegében ugyanazok az URL-ek, de nem egy adott erőforrás helyre mutatnak, hanem egy bejegyzésre a PURL adatbázisban, ahol viszont már rögzítve van egy adott erőforrás URL. A PURL elérésekor a szerver megtalálja a szükséges bejegyzést ebben az adatbázisban , és átirányítja a kérést egy adott erőforrás helyre. Ha az erőforrás címe megváltozik, akkor nem kell javítani a számtalan hivatkozást, csak módosítsa az adatbázis bejegyzését. Jelenleg ez az ötlet nincs szabványosítva, és nem használják széles körben.
Szótárak és enciklopédiák | |
---|---|
Bibliográfiai katalógusokban |