Ékírásos | |
---|---|
Típusú | optikai karakter felismerés |
Szerző | Kognitív technológiák |
Fejlesztők | CuneiForm-Linux csapat |
Beírva | C , C++ |
Felület | parancs sor |
Operációs rendszer | Linux , Mac OS X és más UNIX-szerű |
Első kiadás | 1996 |
legújabb verzió | 1.1.0 (2011. április 19. [1] ) |
Generált fájlformátumok | HOCR |
Állapot | elhagyatott |
Engedély | BSD -szerű licenc a Cognitive Technologiestől [2] |
Weboldal | launchpad.net/cuneiform-… |
CuneiForm ( eng. ékírás , ékírás - ékírás ), a Cognitive OpenOCR az orosz Cognitive Technologies cég szabadon terjesztett nyílt rendszere az optikai szövegfelismeréshez .
Az OCR CuneiForm-ot a Cognitive Technologies fejlesztette ki kereskedelmi termékként 1993-ban. A rendszert a szkennerek, MFP-k és szoftverek legnépszerűbb modelljeivel szállították Oroszországban és a világon: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti stb. 2008-ban a Cognitive A Technologies megnyitotta az OCR Cunei Form forráskódját.
A CuneiForm a papíralapú dokumentumok és grafikus fájlok elektronikus másolatainak szerkeszthető formába való konvertálására szolgáló rendszer, amely képes megőrizni az eredeti dokumentum szerkezetét és betűtípusát automatikus vagy félautomata módban. A rendszer két programot tartalmaz az elektronikus dokumentumok egyszeri és kötegelt feldolgozására.
A rendszer által támogatott nyelvek listája:
Ezenkívül az orosz és az angol nyelv keveréke támogatott. Más nyelvek keverékeinek felismerését csak az Andrey Borovsky által 2009-ben kifejlesztett ág támogatja [3] . Más nyelvek tanítása nehézkes az egyes nyelvek dat-fájlhoz való kapcsolódása miatt, amelynek szerkezetét és megszerzésének módját a fejlesztők nem hozták nyilvánosságra.
1993 – A Cognitive Technologies OEM-szerződést kötött a kanadai Corel Corporation vállalattal , amelynek értelmében a Cognitive felismerő könyvtár beépül a népszerű Corel Draw 3.0 (és az azt követő verziók) kiadói csomagba. [négy]
1994 – Szerződést írtak alá a Hewlett-Packard vállalattal az OCR CuneiForm által Oroszországba szállított teljes szkennerkészletre. Ez a HP első szerződése egy orosz szoftverfejlesztővel. [5] [6] [7] [8]
1995 – Szerződést írtak alá a japán Epson vállalattal a CuneiForm OCR szkennerek teljes készletére. [9] OEM-szerződést írtak alá a világ legnagyobb fax-, lézernyomtató-, szkenner- és egyéb irodai berendezések gyártójával - a Brother Corporation-nel. A megállapodás értelmében az új Brother IC-150 görgős szkennert Cognitive szoftverrel látják el a szkenneléshez, felismeréshez az egész világon.
1996 – OEM-szerződést írtak alá a világ egyik legnagyobb monitorokat, faxokat, lézernyomtatókat, többfunkciós eszközöket és egyéb irodai berendezéseket gyártó cégével, a Samsung Information Systems America-val. [10] A megállapodás értelmében az új Samsung OFFICE MASTER OML-8630A multifunkcionális készüléket a Cognitive Cuneiform LE optikai karakterfelismerő rendszerrel együtt értékesítik világszerte.
Az adaptív felismerés kétféle nyomtatható karakterfelismerő algoritmus kombinációján alapuló módszer: betűtípus-alapú (multifont) és font-független (omnifont). A rendszer minden bemeneti dokumentumhoz belső betűtípust generál, jól nyomtatott karakterek alapján, azaz dinamikus igazítást (adaptációt) alkalmaz az adott bemeneti karakterekhez. A módszer tehát ötvözi a betűtípus nélküli megközelítés sokoldalúságát és gyárthatóságát, valamint a betűtípus-felismerés nagy pontosságát, ami lehetővé teszi a felismerés minőségének radikális javítását.
1997 – A CuneiForm rendszer volt az első, amely neurális hálózatokon alapuló technológiákat használt. A karakterfelismeréshez neurális hálózatokat használó algoritmusok a következőképpen épülnek fel. A felismerésre érkező karakterkép (raszter) egy bizonyos szabványos méretre csökken (normalizálva). A normalizált raszter csomópontjaiban lévő fényerő értékeket a neurális hálózat bemeneti paramétereiként használják. A neurális hálózat kimeneti paramétereinek száma megegyezik a felismerhető karakterek számával. A felismerés eredménye az a szimbólum, amely megfelel a neurális hálózat kimeneti vektorának legnagyobb értékének.
2001 – OEM-szerződést írtak alá a Canon által Cognitive Technologies szoftverrel (OCR CuneiForm) gyártott berendezések (szkennerek, többfunkciós eszközök) komplett kelet-európai kivitelére.
2007. december 12-én megjelent az OCR CuneiForm ingyenes verziója, és bejelentették a forráskódját [15] . [16] [17]
2008. április 2-án BSD licenc alatt megjelent a Cuneiform OCR forráskódja [18] , ősszel pedig a rendszerinterfész forráskódja [19] .
A Windows legújabb OpenSource verziója 2009 februárja óta nem frissült.
2009-ben megjelentek a Cuneiform nyílt verziójának grafikus felületei a Qt 4 könyvtár alapján - Cuneiform-Qt [20] , YAGF . A 0.9.0 [21] verzió óta a nyílt forráskódú Linux verzió használható .
Optikai karakterfelismerő szoftver | |||
---|---|---|---|
ingyenes |
| ||
szabadalmazott |
|