Captcha

A Captcha [1] (a CAPTCHA -ból  – angolul  : Teljesen automatizált nyilvános T uring teszt a számítógépek és az emberek számára A rész egy teljesen automatizált nyilvános Turing - teszt a számítógépek  és az emberek megkülönböztetésére ) egy számítógépes teszt , amelyet annak meghatározására használnak, hogy a felhasználó a rendszer egy ember vagy egy számítógép.

A "Captcha" kifejezés 2000-ben jelent meg. A teszt fő gondolata , hogy egy személy által könnyen megoldható, de egy számítógép számára rendkívül nehéz és időigényes feladatot kínáljon a felhasználónak. 2013-ban naponta körülbelül 320 millió captchát írnak be a felhasználók világszerte [2] .

A CAPTCHA  a Carnegie Mellon Egyetem védjegye , amely ezt a tesztet fejlesztette ki.

Megvalósítási lehetőségek

A captcha legelterjedtebb verziójában a felhasználó a képen látható karaktereket írja be (gyakran zaj vagy áttetszőség hozzáadásával), de úgy, hogy a szöveg gépi felismerése nagyon nehézkes. A látássérültek internet-hozzáférésének általánosan elfogadott szabványai szerint az ilyen captcha-t ki kell egészíteni egy beszédfelismerésen alapuló változattal (audio captcha). Vannak olyan captchák is, ahol ki kell választani a megfelelő képet a listából [3] .

Más, rosszul algoritmikus feladatok is használhatók: például megtudhatja, mi van a képen, jelölje meg az összes képet macskákkal, vagy válaszoljon egy, az emberek tudásával vagy mentalitásával kapcsolatos kérdésre (például a rejtvény: „a körte lóg , nem eheted meg”). Ennek ellenére a karakterfelismerés vált szabványossá: nem kötődik semmilyen kultúrához (a fő akadály a rossz látás), mobilböngészőn is működik, a tapasztalt felhasználó pedig hamar captcha-ként ismer fel egy képet. Kombinált captchák is lehetségesek.

Hibák

A captcha hátránya, hogy nem mindig lehet elemezni. Emiatt néha többször is be kell írni a captchát.

A captcha robot általi átadásának módszerei

A sebezhetőségek kihasználása

Sebezhetőség a CAPTCHA-ban

Tegyük fel, hogy az 1234 -es számú képet a kód hívja:

< img src = "/captcha.php?code=1234" />

A captcha átadása helyett a gép beolvassa az URL-t és beírja a 1234 választ .

Ha nem rendelkezik megfelelő webprogramozói képesítéssel, a bot a teszt sikeres teljesítése nélkül is választ adhat. Például az oldalon található egyes információk szerint maga a számítógép emberi beavatkozás nélkül képes helyesen válaszolni egy olyan kérdésre, amelyre feltehetően csak egy személy tudna válaszolni. Vagy egy személy egyszer átmegy a teszten, és a számítógép sok kérést gyárt ugyanazzal a válasszal.

találgatni

Elsősorban a "nem hagyományos" captchákhoz használják kis számú válaszlehetőséggel (1000 vagy kevesebb). A robot véletlenszerű válaszok küldésével „talál”, és ezek egy része helyesnek bizonyul.

Adatbázisok használata

Ez a megközelítés akkor hatékony, ha a kérdéseket a rendszergazda készíti elő, és nem a gép generálja. Az adatbázisok segítségével számos, nem hagyományos captcha-lehetőségen lehet keresztülmenni: például minden képet megjelölhet macskákkal.

Automatikus felismerés

Nagyon gyenge captcha ( példaként a phpBB használatával ) Fényerő-kivágás kerül alkalmazásra a felső képen (minden, ami valamilyen küszöbértéknél sötétebb, feketévé válik, a többi fehér lesz). A karakterhatárokat meghatározzák, és mindegyiket összehasonlítják a karakterbázissal. Egy ilyen CAPTCHA elemzéséhez még optikai karakterfelismerésre sincs szükség , mivel egyszerre több gyengesége is van:
  • A karakterek egyszerű elválasztása a háttértől egy színes gomb segítségével,
  • A karakterek egymástól való könnyű elválasztása,
  • Fix és torzításmentes betűtípus.

A levágás után egy véletlenszerű minta alakul ki a betűkön, így nincs 100%-os garancia arra, hogy minden karaktert felismernek (PWNtcha-ban ennek a CAPTCH-nak a minősítése 99%). De a maradék egy százalék teljesen lényegtelen.

Az új phpBB fórumszál (3.xx) alapértelmezés szerint egy továbbfejlesztett CAPTCHA, a GD Graphics Library segítségével .

Vannak olyan programok (például: PWNtcha), amelyek felismerik az adott captcha implementációkat. Ezenkívül lehetőség van az általános célú szövegfelismerő programok (például: FineReader , OmniPage ) moduljainak összekapcsolására harmadik féltől származó programokkal a captcha képfelismeréshez.

Az automatizált felismeréssel kapcsolatban létezik a „gyenge captcha” és az „erős captcha” fogalma. A „gyengeségek” közé tartozik a rögzített betűtípus, a karakterek rögzített pozíciója, a torzításmentesség, a karakterek elválasztása a háttértől színes gombbal vagy Gauss-elmosódással , a karakterek egyszerű elkülönítése egymástól stb. Azonban néha előfordul, hogy egy Az erős captcha-t nehéz felismerni és egy személy számára, ami már elfogadhatatlan véglet. Időnként előfordul olyan captcha, amelyet a számítógép könnyen, az ember pedig nagy nehezen beolvas (például alacsony kontrasztú kép esetén), az ilyen captcha egyáltalán nem felel meg a captcha mint olyan céljának.

Ha a generált kép olvashatatlannak bizonyult, a felhasználónak általában lehetősége van újat szerezni. Az erős captcha-nak más válaszú képet kell visszaadnia [4] .

Sok nem hagyományos captcha változat is gyengének bizonyult - "nem robotellenálló" [5] [6] .

Felismerés meghatalmazott által

Létezik egy „felismerési” módszer, amely a nagyon látogatott oldalak emberi erőforrásait használja fel. A robot letölti a captcha-t a szükséges internetes szolgáltatásból, és bemutatja az oldal látogatójának. Cserébe az oldal látogatója hozzáfér az erőforráshoz, a robot pedig felismeri a képen látható kódot és beírja a „megrohadt” oldalra. A webhely látogatója nem is sejtheti, hogy minden megnézett videó egy új postafiók regisztrációjává válik a spam küldésére.

A captcha megkerülésének ettől a módszerétől való (nem teljes) védelem érdekében a webhely automatikusan megváltoztatja a captcha-képet, ha a választ nem adta meg azonnal (rövid időn belül), bizonyos idő elteltével rendszeresen, vagy amikor megpróbálja elkezdeni a megkésett választ.

Vannak speciális oldalak is a captchák cseréjére vagy eladására.

A captcha hasznossága spam ellen

A Captcha önmagában nem tudja megállítani a spamküldőket . Másrészt ez a védekezési módszer nagy kényelmetlenséget okozhat az embereknek.

Ezenkívül a captcha-val visszaélnek például a fájltárolás révén , amely a captcha-felismerés szolgáltatásait tömegekhez juttatja el, és még hatástalanabbá teszi [7] .

Ismert CAPTCHA szolgáltatások

A reCAPTCHA egy olyan projekt, amely olvashatatlan szót használ az OCR -hez , amely a beolvasott könyvek sok torz töredékének egyike, a számítógép által generált szó mellett a captcha-kérésre adott felhasználói válaszok munkaelemekéntEz a szolgáltatás figyelembe veszi a könyvszövegeket digitalizáló programok felhasználási módjait és lehetőségeit . A megbízhatóság érdekében ugyanazt a szót a különböző webhelyek több felhasználója számára kínálják. Ha a különböző felhasználók ugyanazt a választ adják egy CAPTCHA-kérésre, akkor feltételezzük, hogy a helyes szót írták be.

Lásd még

Megjegyzések

  1. Ekaterina Nikolaevna Shagalova  - A legújabb idegen szavak szótára: a 20. század vége-21. század eleje; AST, 2009; 576. o.; ISBN 5-17-061402-0 , ISBN 978-5-17-061402-8
  2. Louis von Ahn: Massive Online Collaboration Archivált : 2012. június 6., a Wayback Machine // TED konferencia , 2011
  3. Basec Captcha . Letöltve: 2015. április 4. Az eredetiből archiválva : 2017. december 4..
  4. Ellenőrző algoritmus  . CAPTCHA.com. Letöltve: 2011. december 4. Az eredetiből archiválva : 2013. április 16..
  5. MintEye CAPTCHA megoldás 23 kódsorban / Habrahabr . Hozzáférés dátuma: 2013. január 21. Az eredetiből archiválva : 2013. február 2..
  6. KeyCaptcha felismerési algoritmus . Archiválva az eredetiből 2012. október 17-én.
  7. Captcha GYIK – JD közösség . Letöltve: 2020. május 3. Az eredetiből archiválva : 2021. január 19.

Linkek