„Optikai karakterfelismerés” változatai közötti eltérés

[ellenőrzött változat][ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
Nincs szerkesztési összefoglaló
ezt mintha valami gyenge fordítóprogrammal alkották volna...
1. sor:
Az '''optikai karakterfelismerés''' vagy az '''optikai karakterolvasókarakterolvasás''', amelyet (angol megfelelője után) gyakran rövidítettekrövidítenek '''OCR'''-ként, a gépelt, kézzel írt vagy nyomtatott szövegek gépi kódolású, mechanikus vagy elektronikus átalakítása,. Ez alapulhat akár beolvasott dokumentumbóldokumentumon vagy dokumentumfotón, akár egymás dokumentum fotójából, egy jelenetfotóbólképen (például a tájképen lévő jelzésekenjelzés, és hirdetőtáblákonhirdetőtáblán találhatószereplő szöveg), vagy atévéműsor feliratú szöveg egy képben (például egyfeliratos televíziósszövege műsorbólesetén) . Széles körben használják a nyomtatott papíradatbázisok információs bejegyzését - legyen az útlevél, számlák, bankszámlakivonatok, számítógépes bevételek, névjegykártyák, levelek, statikus adatok kinyomtatása vagy bármilyen megfelelő dokumentáció - ez a nyomtatásdigitalizálás általános digitalizálásánakmegszokott módja. Ezzel lehet szövegeket úgyolyan formába hozni, hogy azok elektronikusan szerkeszthetők, kereshetők, kompaktabban tárolhatók, legyenek,online megjeleníthetők on-line módonlegyenek, és olyan gépi folyamatokban használhatókfel lehessen használni ezeket, mint a [[kognitív számítástechnika]], a [[gépi fordítás]], és a (kivont) szöveg-beszéd, kulcsadatok és szövegbányászat. Az OCR a [[mintafelismerés]], a [[mesterséges intelligencia]] és a [[Gépi látás|számítógépes látás]] kutatási területe. A korai verziókat mindenaz egyes karakterkarakterek képével kellett képeznibetanítani, és egyszerre csak egy betűtípussal kellettlehetett dolgozniadolgozni. Jelenleg gyakoriak a fejlett rendszerek, amelyek nagyfokú felismerési pontosságot képesek előállítani a legtöbb betűtípus esetében, és számos digitális képfájlformátumképfájlformátumot bemenettámogatnak támogatásávalbemenetként. Egyes Néhányrendszerek rendszer képesképesek formázott kimenet reprodukálására, amely szorosan közelítimegközelíti az eredeti oldaltoldal elrendezését, beleértve a képeket, oszlopokat és más nem szöveges összetevőket is.
 
== Története ==
A korai optikai karakterfelismerés nyomon követhető a telegráfot magában foglaló technológiákkal és az olvasóeszközök létrehozásával a [[vakok]] számára. 1914-ben Emanuel Goldberg kifejlesztett egy olyan gépet, amely karaktereket olvasott, és szabványos [[Morse-kód|távírókóddá]] alakította át.