Szöveggenerátor

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2018. augusztus 13-án áttekintett verziótól ; az ellenőrzéshez 21 szerkesztés szükséges .

A szöveggenerátor  egy számítógépes program , amely szövegeket generál (szleng egy kislány számára ), amely a legtöbb nyelvi norma szempontjából helyes , de általában értelmetlen (amivel kapcsolatban az ilyen programokat néha "téveszmésnek" nevezik). generátorok", "szkizofázia generátorok " ).

Néha az olvasó olyan programszöveget generált (például Markov-lánc segítségével ), amely azt a benyomást keltheti, hogy ez a szöveg értelmes, különösen akkor, ha olyan témája van, amelyet az olvasó nem ismer. Például vannak, akik nem értenek a filozófiához , és értelmetlennek tartanak minden olyan filozófiai szöveget, amely nagyszámú konkrét kifejezést tartalmaz , így nem tudják meghatározni a program által írt álfilozófiai szöveg mesterséges természetét.

Különböző típusú szöveggenerátorok léteznek, amelyek képességeikben különböznek (például egyesek önállóan is képesek új szavakat alkotni).

Jonathan Swift a Gulliver utazásaiban Raymond Lull Ars magna című művének parodizálása közben szatirikusan leírt egy lagadói gépet , amely szövegeket generált.

Generátor típusok

A teljesen véletlenszerű szavakból történő szöveggenerálás szemetes eredményt ad: az ember számára értelmetlen, és a szövegelemzők könnyen felismerik, ezért nem használják. A generálás általában kézzel írt sablonkifejezéseken alapul.

Azokban az esetekben, amikor a generált szöveg jelentése nem fontos, az különböző forrásszövegekből vagy mondatrészekből származó mondatok "masszából" áll össze. Ezt a módszert a sablonokkal és a szinonimizálással együtt a chat-robotokban és a közösségi hálózatokon és blogokban található megjegyzésrobotokban használják. Az ilyen robotok más csevegésekről vagy webhelyekről rögzített kifejezéseket másolnak a beszélgetőpartnernek. A fejlettebb chatbotok kulcsszavak szerint rendezik a kifejezéseket , így válaszuk közelebb áll a párbeszéd témájához.

Szinonimizálók és kifejezésgenerálás sablonokból

A szöveggenerátorokat gyakran szinonimizáló programokkal kombinálják, amelyek automatikusan szinonimákká változtatják a szavakat , hogy átírják és egyedivé tegyék a kifejezéseket. A sablonban szinonimákkal helyettesítendő szavak helyére makrók lépnek .

Minél hosszabb a szöveg, annál észrevehetőbb a természetellenesség az automatikusan javasolt szinonimákban. Ezért a "made for people" ( MDL ) szövegekben a szinonimizálók csak egyedi rövid szövegek létrehozására használhatók: címek és kulcsszavakkal , megjegyzésekkel és bekezdésekkel ellátott horgonyok. A szinonimizálókat sikeresebben használják az angol nyelvben, amely az orosztól eltérően egyszerű morfológiával rendelkezik .

Szinonimizálási típusok:

"Meshanka" szöveg különböző forrásokból

Az ajtók gyorsan "kirepülnek" a keresési eredmények közül a szövegeik rossz minősége miatt. Ezért az ajtóban dolgozók igyekeznek a lehető legkevesebb szöveget generálni. Csak apró kifejezések generálódnak véletlenszerűen az oldal különböző elemeiben, megfelelő jelentéssel. A szöveg bekezdéseit pedig teljes egészükben elemzik ugyanazon témával foglalkozó más oldalakról, és esetleg szinonimizálják őket, vagy „cefrét” használnak .

"Intelligens" generátorok

Számos vállalat kifinomultabb technológiát fejleszt. A szintaktikai szerkezeteket beszédrészek és mondattagok hozzák létre , a szótárak szavait szemantika kategorizálja, további automatikus mondatokká helyettesítve. A munka rendkívüli összetettsége és nagysága, a fejlesztésekhez fűződő szerzői jogok, valamint az üzleti titkok (az ilyen rendszerek elvileg nagyon jövedelmező kereskedelmi projektek létrehozását teszik lehetővé) miatt azonban aligha számíthatunk kommunikáló robotok és fordítórobotok megjelenésére. a következő években.

Alkalmazás

A számítástechnika ezen fejlettségi szintjén nincsenek szabadon elérhető szöveggenerátorok, amelyek viszonylag értelmes szöveget tartalmaznának. Az értelmetlen szavakat vagy képleteket tartalmazó generátorok szűk hatókörűek.

Az egyik szöveggenerátor a Yandex - Balaboba legújabb újdonságának nevezhető, amely képes egy adott kifejezést kiváló minőségű és olvasható kifejezésekkel, sőt egész szövegekkel kiegészíteni.

Számos webhely részletesen ismerteti a szolgáltatás működését.

Weboldal fejlesztés és optimalizálás

A szöveggenerátorokat széles körben használják a webhelyek fejlesztésében és keresőoptimalizálásában : teljes webhelyek címeinek, leírásainak és tartalmának generálására dorgens ( ajtó-generátor ) segítségével.

Vannak nagy angol nyelvű oldalak, amelyek pénzt keresnek a reklámozással, amelyeken nem újságírók írnak minden tartalmat, hanem botok - a cikkek automatikusan átíródnak más forrásokból. Példák ilyen oldalakra: Demand Media és Associated Content [1] . Az orosz nyelv, az angoltól eltérően, összetett morfológiájú, ezért az ilyen átíró robotok megjelenése a Runetben nagyon bonyolult.

A szöveggenerátor segítségével készített, keresőoptimalizálásra használt anyagok az egyediség kritériumának megfelelő, kötelező gondos válogatást igényelnek.[ pontosítás ] Ez a kiválasztás speciális szoftverrel történik, amely eltérő ellenőrzési algoritmussal rendelkezik.

Virtuális beszélgetőpartnerek

A virtuális beszélgetőpartnerek ( chatbotok) olyan programok, amelyek a chatszobákban való kommunikációt imitálják . Széles körben használják kéretlen levelek küldésére a közösségi hálózatokon (spamrobotok), valamint automatikus válaszadókként, amelyek különféle forgatókönyvekben számos kulcsszóra tudnak válaszolni.

Mivel ugyanakkor a személy nem látja a beszélgetőpartnerét, az a benyomás alakulhat ki, hogy egy élő személlyel levelez. Azonban még egyetlen chatbot sem teljesítette sikeresen a Turing-tesztet , és a szöveggenerátorokat használó programok még nehezebbnek találják.

Tömegpropaganda és trollkodás a közösségi oldalakon

Az internetes propaganda és a „kiberháborúk” fejlődése kapcsán a közösségi oldalakon a botokat a közvélemény tömeges utánzására használják. A robotok létrehozásakor automatikusan generálódik a nevük és az internetcímük, válaszukkor pedig a megjegyzések szövege, általában provokatív, propaganda vagy sértő tartalom.

Az orosz nyelvű interneten viszonylag széles körben ismert volt a Rareguest szöveggenerátor, amelyet php szkript formájában terveztek . Egy ideig a "Gavgav Center" szatirikus internetes projekt részeként használták, majd széles körben elterjedt élő magazinok, blogok stb. robotjaként. Íme, példák az azonos típusú üzenetek sorozatos generálására ezzel a robottal:

Minden hozzászólása a hamis célzás tipikus közhelye, amely lejáratni és nevetségessé kíván tenni mindenkit, aki kezd tisztán látni és nyíltan beszélni a bűnözői rezsim bűneiről. Az igazság az embertelenségükről és a véres Kreml rezsim fasiszta lényegéről szúrja a szemét a véres Kreml ghoul idiótáknak! Érdekessége ennek a fórumnak, hogy a putyinisták főként az elárasztással vagy a személyiségek megvitatásával foglalkoznak, és az ehhez hasonló, Oroszország problémáit érintő témák pokolian félnek. Van elég hely a hazudozóban, ahol a hozzád hasonló NKVD-fasiszták tölthetik idejüket anélkül, hogy megterhelnék őket a sztálin- putyinizmus igazsága és elemzése. Ezért gondolom, hogy ti putyinisták erkölcsi degeneráltak vagytok. Hiszen az efféle „vita résztvevői” nem jelennek meg a Kreml és Jastrzsembszkij által ellenőrzött „csecsen” hazug oldalakon. Puti-Put és vérszomjas napszámosai mindenért felelni fognak.

Ezek a példák azt mutatják, hogy még a tárgyalt kérdésekben jártas olvasó is képes átvenni a robot üzeneteit egy valódi élő ember üzenetére, bár kissé magasztosul. A robotot ezekben az üzenetekben csak egy tipikus mondatalkotásra és azok kombinálására szolgáló szerkezet adja ki.

A kiadók szakértői értékelésének minőségének ellenőrzése

Vannak olyan esetek, amikor a szöveggenerátorokat sikeresen alkalmazták a tudományos folyóiratok szakértői értékelésének rossz minőségének (és néha teljes hiányának) kimutatására . Az SCIgen program különösen ismert ebből a szempontból .

Jegyzetek

  1. ↑ Kulcsszótartalom -generátorok . Habrahabr (2010. július 8.). Letöltve: 2015. július 2. Az eredetiből archiválva : 2015. július 3.

Linkek