Ékírásos

Ékírásos
Típusú optikai karakter felismerés
Szerző Kognitív technológiák
Fejlesztők CuneiForm-Linux csapat
Beírva C , C++
Felület parancs sor
Operációs rendszer Linux , Mac OS X és más UNIX-szerű
Első kiadás 1996
legújabb verzió 1.1.0 (2011. április 19. [1] )
Generált fájlformátumok HOCR
Állapot elhagyatott
Engedély BSD -szerű licenc a Cognitive Technologiestől [2]
Weboldal launchpad.net/cuneiform-…

CuneiForm ( eng.  ékírás , ékírás  - ékírás ), a Cognitive OpenOCR  az orosz Cognitive Technologies cég szabadon terjesztett nyílt rendszere az optikai szövegfelismeréshez .

Az OCR CuneiForm-ot a Cognitive Technologies fejlesztette ki kereskedelmi termékként 1993-ban. A rendszert a szkennerek, MFP-k és szoftverek legnépszerűbb modelljeivel szállították Oroszországban és a világon: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti stb. 2008-ban a Cognitive A Technologies megnyitotta az OCR Cunei Form forráskódját.

Jellemzők

A CuneiForm a papíralapú dokumentumok és grafikus fájlok elektronikus másolatainak szerkeszthető formába való konvertálására szolgáló rendszer, amely képes megőrizni az eredeti dokumentum szerkezetét és betűtípusát automatikus vagy félautomata módban. A rendszer két programot tartalmaz az elektronikus dokumentumok egyszeri és kötegelt feldolgozására.

A rendszer által támogatott nyelvek listája:

Ezenkívül az orosz és az angol nyelv keveréke támogatott. Más nyelvek keverékeinek felismerését csak az Andrey Borovsky által 2009-ben kifejlesztett ág támogatja [3] . Más nyelvek tanítása nehézkes az egyes nyelvek dat-fájlhoz való kapcsolódása miatt, amelynek szerkezetét és megszerzésének módját a fejlesztők nem hozták nyilvánosságra.

Történelem

1993  – A Cognitive Technologies OEM-szerződést kötött a kanadai Corel Corporation vállalattal , amelynek értelmében a Cognitive felismerő könyvtár beépül a népszerű Corel Draw 3.0 (és az azt követő verziók) kiadói csomagba. [négy]

1994  – Szerződést írtak alá a Hewlett-Packard vállalattal az OCR CuneiForm által Oroszországba szállított teljes szkennerkészletre. Ez a HP első szerződése egy orosz szoftverfejlesztővel. [5] [6] [7] [8]

1995  – Szerződést írtak alá a japán Epson vállalattal a CuneiForm OCR szkennerek teljes készletére. [9] OEM-szerződést írtak alá a világ legnagyobb fax-, lézernyomtató-, szkenner- és egyéb irodai berendezések gyártójával - a Brother Corporation-nel. A megállapodás értelmében az új Brother IC-150 görgős szkennert Cognitive szoftverrel látják el a szkenneléshez, felismeréshez az egész világon.

1996  – OEM-szerződést írtak alá a világ egyik legnagyobb monitorokat, faxokat, lézernyomtatókat, többfunkciós eszközöket és egyéb irodai berendezéseket gyártó cégével, a Samsung Information Systems America-val. [10] A megállapodás értelmében az új Samsung OFFICE MASTER OML-8630A multifunkcionális készüléket a Cognitive Cuneiform LE optikai karakterfelismerő rendszerrel együtt értékesítik világszerte.

Az adaptív felismerés  kétféle nyomtatható karakterfelismerő algoritmus kombinációján alapuló módszer: betűtípus-alapú (multifont) és font-független (omnifont). A rendszer minden bemeneti dokumentumhoz belső betűtípust generál, jól nyomtatott karakterek alapján, azaz dinamikus igazítást (adaptációt) alkalmaz az adott bemeneti karakterekhez. A módszer tehát ötvözi a betűtípus nélküli megközelítés sokoldalúságát és gyárthatóságát, valamint a betűtípus-felismerés nagy pontosságát, ami lehetővé teszi a felismerés minőségének radikális javítását.

1997  – A CuneiForm rendszer volt az első, amely neurális hálózatokon alapuló technológiákat használt. A karakterfelismeréshez neurális hálózatokat használó algoritmusok a következőképpen épülnek fel. A felismerésre érkező karakterkép (raszter) egy bizonyos szabványos méretre csökken (normalizálva). A normalizált raszter csomópontjaiban lévő fényerő értékeket a neurális hálózat bemeneti paramétereiként használják. A neurális hálózat kimeneti paramétereinek száma megegyezik a felismerhető karakterek számával. A felismerés eredménye az a szimbólum, amely megfelel a neurális hálózat kimeneti vektorának legnagyobb értékének.

1999

2001  – OEM-szerződést írtak alá a Canon által Cognitive Technologies szoftverrel (OCR CuneiForm) gyártott berendezések (szkennerek, többfunkciós eszközök) komplett kelet-európai kivitelére.

2007. december 12-én megjelent az OCR CuneiForm ingyenes verziója, és bejelentették a forráskódját [15] . [16] [17]

2008. április 2-án BSD licenc alatt megjelent a Cuneiform OCR forráskódja [18] , ősszel pedig a rendszerinterfész forráskódja [19] .

A Windows legújabb OpenSource verziója 2009 februárja óta nem frissült.

2009-ben megjelentek a Cuneiform nyílt verziójának grafikus felületei a Qt 4 könyvtár alapján  - Cuneiform-Qt [20] , YAGF . A 0.9.0 [21] verzió óta a nyílt forráskódú Linux verzió használható .

Grafikus interfészek a CuneiFormhoz

Lásd még

Jegyzetek

  1. ↑ Az ékírás portja Linuxhoz. . Letöltve: 2008. július 22. Az eredetiből archiválva : 2011. május 20.
  2. Licenc szövege. Az eredetiből archiválva : 2012. március 19.
  3. ~anb-symmetrica/cuneiform-linux/cuneiform-multilang : revision 400
  4. Oroszországban készült (elérhetetlen link) . Letöltve: 2016. december 6. Az eredetiből archiválva : 2013. június 27. 
  5. ↑ " Legitimate " A HP szkennerek megtanulnak oroszul olvasni
  6. CuneiForm jelzéssel ellátott HP szkennerek . Hozzáférés időpontja: 2016. december 6. Az eredetiből archiválva : 2016. december 20.
  7. A Hewlett-Packard új termékeket mutat be Moszkvában Archiválva : 2014. április 16., a Wayback Machine , Algonet
  8. A HP és a Cognitive elmélyíti a partnerséget Archiválva : 2016. december 20. a Wayback Machine -en , PCweek
  9. PC World. Az orosz szoftver gyöngyei . Letöltve: 2016. november 29. Az eredetiből archiválva : 2014. április 16..
  10. A Samsung kiválasztotta a kognitív technológia OCR-jét többfunkciós készülékekhez Archiválva : 2016. december 20., a Wayback Machine , PCweek, 1996.10.09.
  11. Vladimir Mitin Canon többfunkciós készülékei új, minőségi archív példányt szereztek be 2016. december 20-án a Wayback Machine -nél, PCweek, 1998.05.12.
  12. Vladimir Mitin A Canon -Cognitive Technologies Alliance sikeresen fejlődik
  13. A Cognitive Technologies és az OKI rálép a gázra Archiválva : 2016. december 20., a Wayback Machine , PCweek
  14. HP informális marketing archiválva : 2016. december 20., a Wayback Machine , Computer World
  15. OCR CuneiForm – az első ipari nyílt forráskódú projekt az elismerés területén Archiválva : 2011. május 25.
  16. Az orosz CuneiForm szövegfelismerő rendszer 2016. december 20-i archív példánya lesz a Wayback Machine Сybersecurity oldalán, 2007.12.06.
  17. CuneiForm Returns archiválva : 2016. december 20., a Wayback Machine , Computerworld, 2007.12.24.
  18. Cognitive Technologies nyílt forráskódú ékírásos OCR-kód (lefelé irányuló kapcsolat) . Letöltve: 2011. április 4. Az eredetiből archiválva : 2009. november 11.. 
  19. A Cognitive Technologies Open ékírásos OCR kód archiválva : 2011. április 19.
  20. Ékírás-Qt . Letöltve: 2009. április 9. Az eredetiből archiválva : 2009. április 12..
  21. Megjelent a Cuneiform Linux 0.9.0 . Hozzáférés időpontja: 2010. február 8. Az eredetiből archiválva : 2014. január 26..

Linkek