A szöveggenerátor egy számítógépes program , amely szövegeket generál (szleng egy kislány számára ), amely a legtöbb nyelvi norma szempontjából helyes , de általában értelmetlen (amivel kapcsolatban az ilyen programokat néha "téveszmésnek" nevezik). generátorok", "szkizofázia generátorok " ).
Néha az olvasó olyan programszöveget generált (például Markov-lánc segítségével ), amely azt a benyomást keltheti, hogy ez a szöveg értelmes, különösen akkor, ha olyan témája van, amelyet az olvasó nem ismer. Például vannak, akik nem értenek a filozófiához , és értelmetlennek tartanak minden olyan filozófiai szöveget, amely nagyszámú konkrét kifejezést tartalmaz , így nem tudják meghatározni a program által írt álfilozófiai szöveg mesterséges természetét.
Különböző típusú szöveggenerátorok léteznek, amelyek képességeikben különböznek (például egyesek önállóan is képesek új szavakat alkotni).
Jonathan Swift a Gulliver utazásaiban Raymond Lull Ars magna című művének parodizálása közben szatirikusan leírt egy lagadói gépet , amely szövegeket generált.
A teljesen véletlenszerű szavakból történő szöveggenerálás szemetes eredményt ad: az ember számára értelmetlen, és a szövegelemzők könnyen felismerik, ezért nem használják. A generálás általában kézzel írt sablonkifejezéseken alapul.
Azokban az esetekben, amikor a generált szöveg jelentése nem fontos, az különböző forrásszövegekből vagy mondatrészekből származó mondatok "masszából" áll össze. Ezt a módszert a sablonokkal és a szinonimizálással együtt a chat-robotokban és a közösségi hálózatokon és blogokban található megjegyzésrobotokban használják. Az ilyen robotok más csevegésekről vagy webhelyekről rögzített kifejezéseket másolnak a beszélgetőpartnernek. A fejlettebb chatbotok kulcsszavak szerint rendezik a kifejezéseket , így válaszuk közelebb áll a párbeszéd témájához.
A szöveggenerátorokat gyakran szinonimizáló programokkal kombinálják, amelyek automatikusan szinonimákká változtatják a szavakat , hogy átírják és egyedivé tegyék a kifejezéseket. A sablonban szinonimákkal helyettesítendő szavak helyére makrók lépnek .
Minél hosszabb a szöveg, annál észrevehetőbb a természetellenesség az automatikusan javasolt szinonimákban. Ezért a "made for people" ( MDL ) szövegekben a szinonimizálók csak egyedi rövid szövegek létrehozására használhatók: címek és kulcsszavakkal , megjegyzésekkel és bekezdésekkel ellátott horgonyok. A szinonimizálókat sikeresebben használják az angol nyelvben, amely az orosztól eltérően egyszerű morfológiával rendelkezik .
Szinonimizálási típusok:
Az ajtók gyorsan "kirepülnek" a keresési eredmények közül a szövegeik rossz minősége miatt. Ezért az ajtóban dolgozók igyekeznek a lehető legkevesebb szöveget generálni. Csak apró kifejezések generálódnak véletlenszerűen az oldal különböző elemeiben, megfelelő jelentéssel. A szöveg bekezdéseit pedig teljes egészükben elemzik ugyanazon témával foglalkozó más oldalakról, és esetleg szinonimizálják őket, vagy „cefrét” használnak .
Számos vállalat kifinomultabb technológiát fejleszt. A szintaktikai szerkezeteket beszédrészek és mondattagok hozzák létre , a szótárak szavait szemantika kategorizálja, további automatikus mondatokká helyettesítve. A munka rendkívüli összetettsége és nagysága, a fejlesztésekhez fűződő szerzői jogok, valamint az üzleti titkok (az ilyen rendszerek elvileg nagyon jövedelmező kereskedelmi projektek létrehozását teszik lehetővé) miatt azonban aligha számíthatunk kommunikáló robotok és fordítórobotok megjelenésére. a következő években.
A számítástechnika ezen fejlettségi szintjén nincsenek szabadon elérhető szöveggenerátorok, amelyek viszonylag értelmes szöveget tartalmaznának. Az értelmetlen szavakat vagy képleteket tartalmazó generátorok szűk hatókörűek.
Az egyik szöveggenerátor a Yandex - Balaboba legújabb újdonságának nevezhető, amely képes egy adott kifejezést kiváló minőségű és olvasható kifejezésekkel, sőt egész szövegekkel kiegészíteni.
Számos webhely részletesen ismerteti a szolgáltatás működését.
A szöveggenerátorokat széles körben használják a webhelyek fejlesztésében és keresőoptimalizálásában : teljes webhelyek címeinek, leírásainak és tartalmának generálására dorgens ( ajtó-generátor ) segítségével.
Vannak nagy angol nyelvű oldalak, amelyek pénzt keresnek a reklámozással, amelyeken nem újságírók írnak minden tartalmat, hanem botok - a cikkek automatikusan átíródnak más forrásokból. Példák ilyen oldalakra: Demand Media és Associated Content [1] . Az orosz nyelv, az angoltól eltérően, összetett morfológiájú, ezért az ilyen átíró robotok megjelenése a Runetben nagyon bonyolult.
A szöveggenerátor segítségével készített, keresőoptimalizálásra használt anyagok az egyediség kritériumának megfelelő, kötelező gondos válogatást igényelnek.[ pontosítás ] Ez a kiválasztás speciális szoftverrel történik, amely eltérő ellenőrzési algoritmussal rendelkezik.
A virtuális beszélgetőpartnerek ( chatbotok) olyan programok, amelyek a chatszobákban való kommunikációt imitálják . Széles körben használják kéretlen levelek küldésére a közösségi hálózatokon (spamrobotok), valamint automatikus válaszadókként, amelyek különféle forgatókönyvekben számos kulcsszóra tudnak válaszolni.
Mivel ugyanakkor a személy nem látja a beszélgetőpartnerét, az a benyomás alakulhat ki, hogy egy élő személlyel levelez. Azonban még egyetlen chatbot sem teljesítette sikeresen a Turing-tesztet , és a szöveggenerátorokat használó programok még nehezebbnek találják.
Tömegpropaganda és trollkodás a közösségi oldalakonAz internetes propaganda és a „kiberháborúk” fejlődése kapcsán a közösségi oldalakon a botokat a közvélemény tömeges utánzására használják. A robotok létrehozásakor automatikusan generálódik a nevük és az internetcímük, válaszukkor pedig a megjegyzések szövege, általában provokatív, propaganda vagy sértő tartalom.
Az orosz nyelvű interneten viszonylag széles körben ismert volt a Rareguest szöveggenerátor, amelyet php szkript formájában terveztek . Egy ideig a "Gavgav Center" szatirikus internetes projekt részeként használták, majd széles körben elterjedt élő magazinok, blogok stb. robotjaként. Íme, példák az azonos típusú üzenetek sorozatos generálására ezzel a robottal:
Minden hozzászólása a hamis célzás tipikus közhelye, amely lejáratni és nevetségessé kíván tenni mindenkit, aki kezd tisztán látni és nyíltan beszélni a bűnözői rezsim bűneiről. Az igazság az embertelenségükről és a véres Kreml rezsim fasiszta lényegéről szúrja a szemét a véres Kreml ghoul idiótáknak! Érdekessége ennek a fórumnak, hogy a putyinisták főként az elárasztással vagy a személyiségek megvitatásával foglalkoznak, és az ehhez hasonló, Oroszország problémáit érintő témák pokolian félnek. Van elég hely a hazudozóban, ahol a hozzád hasonló NKVD-fasiszták tölthetik idejüket anélkül, hogy megterhelnék őket a sztálin- putyinizmus igazsága és elemzése. Ezért gondolom, hogy ti putyinisták erkölcsi degeneráltak vagytok. Hiszen az efféle „vita résztvevői” nem jelennek meg a Kreml és Jastrzsembszkij által ellenőrzött „csecsen” hazug oldalakon. Puti-Put és vérszomjas napszámosai mindenért felelni fognak.
Ezek a példák azt mutatják, hogy még a tárgyalt kérdésekben jártas olvasó is képes átvenni a robot üzeneteit egy valódi élő ember üzenetére, bár kissé magasztosul. A robotot ezekben az üzenetekben csak egy tipikus mondatalkotásra és azok kombinálására szolgáló szerkezet adja ki.
Vannak olyan esetek, amikor a szöveggenerátorokat sikeresen alkalmazták a tudományos folyóiratok szakértői értékelésének rossz minőségének (és néha teljes hiányának) kimutatására . Az SCIgen program különösen ismert ebből a szempontból .
természetes nyelvi feldolgozás | |
---|---|
Általános meghatározások | |
Szövegelemzés |
|
Hivatkozás |
|
Gépi fordítás |
|
Azonosítás és adatgyűjtés | |
Tematikus modell | |
Peer review |
|
Természetes nyelvű felület |