A hOCR egy nyílt szabvány, amely meghatározza az OCR kimenet megjelenítési formátumát. A szabvány célja, hogy a felismert szöveghez információkat csatoljon az elrendezésről, a felismerési megbízhatósági szintről, a stílusról és egyéb adatokról. Az információ felismert szövegbe történő bevitelének eléréséhez a szabványos HTML formátumot használják .
Van egy hocr2pdf [1] parancssori segédprogram a hocr adatok PDF fájlokká konvertálására .