Jelölőnyelv ( szöveg ) a számítógépes terminológiában – a szövegbe beillesztett karakterek vagy karaktersorozatok halmaza, amely információkat közöl a szöveg megjelenítéséről vagy szerkezetéről. A számítógépes nyelvek osztályába tartozik . A jelölőnyelvvel írt szöveges dokumentum nemcsak magát a szöveget tartalmazza (szósorozatként és írásjelként), hanem további információkat is tartalmaz a különböző szakaszairól - például címsorok, kiemelések, listák stb. összetett esetek A jelölőnyelv lehetővé teszi interaktív elemek és tartalom beszúrását más dokumentumokból egy dokumentumba.
Meg kell jegyezni, hogy a jelölőnyelv Turing hiányos , és általában nem tekinthető programozási nyelvnek .
Tegyen különbséget a logikai és a vizuális jelölés között. Az első esetben csak arról beszélünk, hogy a dokumentum ezen része milyen szerepet játszik az általános szerkezetében (például „ez a sor a címsor”). A második meghatározza, hogy ez az elem pontosan hogyan jelenjen meg (például "ezt a sort félkövérrel kell megjeleníteni"). A jelölőnyelvek mögött az az elképzelés áll, hogy a dokumentum vizuális megjelenítésének automatikusan a logikai jelölésből kell származnia, és függetlennek kell lennie annak közvetlen tartalmától. Ez leegyszerűsíti egy dokumentum automatikus feldolgozását és megjelenítését különböző körülmények között (például ugyanaz a fájl másképp jelenhet meg számítógép képernyőjén, mobiltelefonon és nyomtatáson, mivel ezeknek a kimeneti eszközöknek a tulajdonságai jelentősen eltérnek). Ezt a szabályt azonban gyakran megsértik: például amikor egy dokumentumot hoz létre egy olyan szerkesztőben, mint az MS Word , a felhasználó félkövérre teheti a címsorokat, de sehol nem jelzi, hogy ez a sor címsor.
A jelölőnyelveket mindenhol használják, ahol csak szövegből formázott szöveget kell nyerni : tipográfiában SGML , TeX , PostScript , RTF ), számítógépes felhasználói felületeken ( Microsoft Word , OpenOffice ), a világhálón ( HTML , XHTML ) , XML , WML , VML , PGML , SVG , XBRL ).
A Wikipédia forrásszövegeinek írásához tagjai egy speciális jelölőnyelvet használnak (lásd Wikipédia: Cikkek szerkesztése ), összetett matematikai képletek megjelenítéséhez pedig a TeX nyelvet .
Azokat a nyelveket, amelyeket arra terveztek, hogy könnyen és gyorsan formázzanak a szöveges adatokhoz , könnyűsúlyúnak ( en:Lightweight markup language ) nevezik . Az ilyen nyelvek jellemzői:
Ott használatosak, ahol az embernek szöveget kell készítenie egy normál szövegszerkesztőben ( blogok , fórumok , wikik ), vagy ahol fontos, hogy egy normál szövegszerkesztővel rendelkező felhasználó is el tudja olvasni a szöveget. Íme néhány széles körben használt könnyű jelölőnyelv:
A "markup" kifejezés (az azonos nevű folyamat eredményeként, eng. markup ) az angol " marking up " ("marking (mint process)", szó szerint "marking, marking") kifejezésből származik. a hagyományos kiadói gyakorlatból, hogy a margókra és a kézirat szövegébe vagy a lektorálásba speciális feltételes jeleket helyeznek a nyomtatásra küldés előtt. Így a „jelölőemberek” a szöveg egyes részeinek betűtípusát, stílusát és betűméretét jelezték. Napjainkban a szövegjelöléssel a szerkesztők, lektorok, grafikusok és természetesen maguk a szerzők foglalkoznak.
A jelölőnyelvek számítógépes szövegszerkesztésben való használatának ötletét valószínűleg először William W. Tunnicliffe tette közzé egy 1967 -es konferencián . Ő maga "univerzális kódolásnak" ( eng. "generic coding" ) nevezte javaslatát . Az 1970-es években Tunnicliffe vezette a kiadói ipar számára a GenCode szabvány kidolgozását, majd a Nemzetközi Szabványügyi Szervezet (ISO) egyik bizottságának elnöke lett, amely létrehozta az SGML -t , az első leíró jelölőnyelvet. Brian Reid ( ang. Brian Reid (számítógép tudós) ) disszertációjában, amelyet 1980 -ban védett meg a Carnegie Egyetemen ( eng. Carnegie Mellon University ), a javasolt koncepció kidolgozása során a leíró jelölés gyakorlati megvalósítását hajtotta végre.
Charles Goldfarbot , az IBM kutatóját azonban ma már a jelölőnyelvek "atyjaként" emlegetik . Az alapkoncepció 1969 -ben fogalmazódott meg benne, miközben egy primitív, ügyvédi irodák számára készült dokumentumkezelő rendszeren dolgozott. Ugyanebben az évben részt vett az IBM GML nyelv megalkotásában , amelyet először 1973 -ban vezettek be .
1975 -ben Goldfarb a massachusettsi Cambridge-ből a Szilícium-völgybe költözött , ahol az IBM Almaden Research Center fejlesztője lett. Ott 1978-ban meggyőzte az IBM vezetőségét, hogy a GML-t kereskedelmi célokra használják a vállalat Dokumentumkészítő eszközének részeként , majd a GML-t több évig széles körben használták az üzleti életben.
1978-ban kezdődtek az első fejlesztések, amelyek végül a GML-en és GenCode-on alapuló SGML szabvány megalkotásához vezettek. Később maga Goldfarb volt az SGML bizottság elnöke, amelyet az ISO szabványként fogadott el 1986 októberében .
A számítógépes jelölőnyelvek néhány korai megvalósítása megtalálható a UNIX tipográfiai segédprogramokban , például a troff és az nroff . Lehetővé teszik formázási parancsok beszúrását a dokumentum szövegébe, hogy a szerkesztő követelményei szerint formázzák azt.
A WYSIWYG ( amit lát, azt kap) kiadói szoftver elérhetősége kiszorította e nyelvek többségét az általános felhasználók körében, bár a komoly kiadói munkák még mindig jelöléseket használnak bizonyos nem vizuális struktúrákhoz. jelölőnyelven alapuló formátumú dokumentumokat.
Egy másik fontos kiadói szabvány a Τ Ε Χ , amelyet Donald Knuth hozott létre, majd továbbfejlesztett a huszadik század 70-es és 80-as éveiben. A Τ Ε Χ nagy lehetőségeket hozott össze a szövegformázásban és a betűtípusleírásokban, különösen a professzionális minőségű matematikai könyveknél. Jelenleg a Τ Ε Χ a de facto szabvány számos tudományágban. A Τ Ε Χ mellett létezik a LaTeX , amely egy Τ Ε Χ alapú, széles körben használt leíró jelölőrendszer .
Az első nyelv, amely világosan és határozottan megkülönböztette a dokumentum szerkezetét és típusát, a Scribe volt, amelyet Brian Reid doktori disszertációja hozott létre és írt le 1980-ban. A Scribe forradalmi volt a feldolgozási módok számában, nem utolsósorban az olyan stílusok ötletének bevezetése miatt, amelyek elkülönülnek a tényleges szövegtől és nyelvtantól, és szabályozzák a leíró elemek használatát. Scribe befolyással volt a GML nyelv (később SGML) fejlesztésére, és a HTML és a LaTeX nyelvek közvetlen őse is .
A 80- as évek elején az az ötlet, hogy a jelölésnek a dokumentum strukturális aspektusaira kell összpontosítania, és a dokumentum külső megjelenítését az értelmezőre kell hagynia, az SGML létrehozásához vezetett. A nyelvet egy Goldfarb vezette bizottság fejlesztette ki. Számos forrásból származó ötleteket egyesített, köztük a Tunnikofflick projektből, a GenCode-ból. Sharon Adler, Anders Berglund és James A. Marke is kulcsfontosságú tagjai voltak az SGML bizottságnak.
Az SGML pontosan meghatározta a jelölések szövegbe foglalásának szintaxisát, és külön leírta, hogy mely címkék engedélyezettek és hol (DTD - Document Type Definition). Ez lehetővé tette a szerzők számára, hogy tetszőleges jelölést hozzanak létre és használhassanak, kiválasztva a használni kívánt címkéket, és a normál nyelven nevezve őket. Így az SGML-t metanyelvnek kell tekinteni ; több speciális jelölőnyelv is származott belőle. A 80-as évek vége volt a legjelentősebb az SGML-en alapuló új jelölőnyelvek, például a TEI és a DocBook megjelenésében .
1986-ban az SGML-t nemzetközi szabványként tette közzé az ISO 8879-es szám alatt. Az SGML széles körben elfogadott és széles körben használatos nagyon nagy projektekben. Általában azonban nehézkesnek és nehezen megtanulhatónak találták, a nyelv mellékhatása volt, hogy túl sokat próbált tenni és túl rugalmas volt. Például az SGML olyan zárócímkéket (vagy kezdőcímkéket, vagy akár mindkettőt) hozott létre, amelyekre nem mindig volt szükség, mert úgy gondolta, hogy ezt a jelölést a projekt támogató személyzete manuálisan adja hozzá, és értékelné a billentyűleütések megtakarítását.
1991-re az SGML használata az üzleti programokra és adatbázisokra korlátozódott, míg a WYSIWYG eszközöket (amelyek szabadalmaztatott bináris formátumban mentették a dokumentumokat) más dokumentumfeldolgozó programokhoz használták. Ez megváltozott, amikor Sir Tim Berners-Lee , miután megismerte az SGML-t kollégájától, Anders Berglundtól és másoktól a CERN -ben, az SGML szintaxist használta a HTML létrehozásához . A nyelv hasonlóságokat mutatott más, az SGML szintaxison alapuló jelölőnyelvekkel, de sokkal könnyebb volt elkezdeni, még azoknak a fejlesztőknek is, akik még soha nem tették. Steven DeRose azzal érvelt, hogy a leíró jelölést használó HTML (és különösen az SGML-ből) fontos tényező volt a web fejlődésében, mivel rugalmasnak és bővíthetőnek tervezték (valamint más tényezők is, mint például az URL-ek fogalma és a böngészők általi szabad használat. ).
A HTML jelölőnyelvként való státuszát azonban egyes informatikusok vitatták. Fő érvük az, hogy a HTML korlátozza a címkék elhelyezését azáltal, hogy mindkét címkét más címkékbe vagy a dokumentum fő címkéibe kell beágyazni. Ennek eredményeként ezek a tudósok a HTML-t egy hierarchikus modellt követő konténernyelvnek tekintik.
Az XML (Extensible Markup Language) egy manapság széles körben használt meta-jelölőnyelv. Az XML-t a World Wide Web Consortium fejlesztette ki a Jon Bosak elnökletével működő bizottságban. Az XML fő célja, hogy egyszerűbb legyen, mint az SGML, és egy konkrét problémára összpontosítson – a weben található dokumentumokra. Az XML egy metanyelv, mint az SGML, a felhasználók tetszőleges címkéket hozhatnak létre (ezért "bővíthető"). Az XML felemelkedését az segítette elő, hogy minden XML dokumentumot ugyanúgy lehetett írni, mint egy SGML-dokumentumot, és az SGML-t használó programok és felhasználók meglehetősen könnyen áttérhettek XML-re.
Az XML azonban elveszítette az SGML számos emberközpontú funkcióját, amelyek megkönnyítették a használatát (amíg a jelölések mennyisége meg nem nőtt, és az olvashatóság és a szerkeszthetőség vissza nem álltak ugyanarra a szintre). Más fejlesztések javítottak néhány SGML-problémát nemzetközi szinten, és lehetővé tették a dokumentumok hierarchikus elemzését még akkor is, ha nem volt elérhető DTD.
Az XML-t elsősorban félig strukturált környezetekhez, például dokumentumokhoz és kiadványokhoz tervezték. Ez azonban a rugalmasság és az egyszerűség közötti édes pontot eredményezte, és sok felhasználó gyorsan átvette. Manapság az XML-t széles körben használják a programok közötti adatátvitelre. A HTML-hez hasonlóan "tároló" nyelvként írható le.
XHTML2000 januárja óta a W3C-hez intézett összes ajánlás XML-en alapul SGML helyett , és javasolták az XHTML (Extensible HyperText Markup Language) betűszót. A nyelvi specifikációk megkövetelték, hogy az XHTML-dokumentumokat XML-dokumentumként kell formázni, ez lehetővé teszi az XHTML használatát világosabb és pontosabb dokumentumokhoz HTML-címkék segítségével.
Az egyik legfigyelemreméltóbb különbség a HTML és az XHTML között az a szabály, hogy minden címkét be kell zárni: az üres címkéket, mint például a < br /> , mindkettőt szabványos záró címkével vagy speciális jelöléssel kell lezárni: < br /> (szóköz előtt A "/" a záró címkében nem kötelező, de gyakran használják, mert egyes XML előtti böngészők (szintén SGML-elemzők) használják). A címkékben szereplő többi attribútumnak idézőjelben kell lennie. Végül minden címkét és attribútumnevet kisbetűvel kell írni a helyes olvasáshoz; A HTML nem érzékeny a kis- és nagybetűkre.
Egyéb XML alapú fejlesztésekSzámos XML -alapú fejlesztést használnak , például az RDF-et (Resource Description Framework – erőforrásleíró környezet) , az XFORMS-t, a DocBook -ot , a SOAP -t és az OWL-t (Web Ontology Language) .
Az összes jelölőnyelv közös jellemzője, hogy a dokumentum szövegét keverik a jelölési utasításokkal egy adatfolyamban vagy fájlban. Nem szükséges, a jelölések elkülönítése a szövegtől mutatókkal, címkékkel, azonosítókkal vagy egyéb koordinációs módszerekkel lehetséges. Ez az „elkülönített jelölés” a jelölődokumentumokkal dolgozó programok belső megjelenítésére jellemző. A beágyazott vagy "sorközi" jelölés azonban máshol elfogadottabb. Például itt van egy kis szövegrész HTML-lel megjelölve:
< h1 > Anatidae </ h1 > < p > Az < i > Anatidae </ i > családba kacsák, libák és hattyúk tartoznak, de < em > nem </ em > a közeli rokon sikoltozók. </ p >A jelölő utasítás kódja (más néven címkék ) szögletes zárójelekkel van körülvéve <ilyen>. Az utasítások közötti szöveg a dokumentum szövege. A h1 , p és em kódok a strukturális jelölések példái, a benne foglalt szöveg helyzetét, célját vagy jelentését írják le.
Pontosabban, a h1 azt jelenti, hogy "ez egy első szintű címsor", a p azt jelenti, hogy "ez egy bekezdés", és az em azt jelenti, hogy "ez a szó vagy kifejezés különleges hangsúlyt kap". Az értelmező ezeket a szabályokat vagy stílusokat alkalmazhatja a szöveg különböző részeinek megjelenítésére, szükség szerint különböző betűtípusok, betűméretek, behúzások, színek vagy más stílusok használatával. Így például egy h1 címke nagy, félkövér betűtípussal jeleníthető meg, vagy egy egyszóközű szöveget tartalmazó dokumentumban (például egy írógépen) aláhúzva lehet, vagy egyáltalán nem változtatja meg a megjelenését. Az em címke tartalma pedig általában dőlt betűvel jelenik meg.
Ezzel szemben az i címke a HTML -ben a vizuális jelölés példája; általában a szöveg meghatározott jellemzőinek azonosítására szolgál (ebben a blokkban használjon dőlt betűtípust) magyarázat nélkül.
A TEI (Tex Encoding Initiative) átfogó útmutató dokumentumokat tett közzé, amelyek meghatározzák, hogyan kell kódolni szöveget az emberiség és a tudományos társaságok javára. Ezeket a kézikönyveket történelmi dokumentumok, tudósok konkrét munkáinak, folyóiratok stb. kódolására használták.
Míg a jelölőnyelvek szöveges dokumentumokkal való használatának ötlete fejlődött, ez más területeken is megnövelte a jelölőnyelvek használatát. Javasolták, hogy különféle típusú információk megjelenítésére használják őket, beleértve a lejátszási listákat , vektorgrafikákat, webszolgáltatásokat és felhasználói felületeket. Ezen alkalmazások többsége XML-en alapul, mivel ez egy erősen strukturált és bővíthető nyelv.
Az XHTML nyelv használata azt is mutatja, hogy kombinálható ugyanazon profil különböző jelölőnyelveivel, mint például az XHTML+SMIL vagy az XHTML+MathML+SVG.
Szótárak és enciklopédiák | ||||
---|---|---|---|---|
|
Dokumentum jelölőnyelvek | |
---|---|
irodai dokumentumok | |
közismert | |
Kevésbé ismert |