Recunoașterea optică a caracterelor
Recunoașterea Optică a Caracterelor (engleză Optical character recognition), abreviată și OCR, reprezintă translatarea mecanică sau electronică a imaginilor cu scris de mână, tipărit sau printat (de obicei scanat) în text editabil.
OCR este un domeniu de cercetare în recunoașterea modelelor, inteligența artificială și vederea mecanică. Recunoașterea optică a caracterelor (folosind metode optice ca oglinzi și lentile) și recunoașterea digitală a caracterelor (folosind scanere și algoritmi pe calculator) au fost, inițial, considerate domenii diferite. Deoarece puține aplicații folosesc tehnici optice, termenul OCR include și procesarea digitală a documentelor.
Programele inițiale necesitau învățarea caracterelor (exemple ale fiecărui caracter) pentru a identifica un font specific. Astăzi există programe „inteligente” care au un grad mai mare de acuratețe, putând identifica majoritatea fonturilor. Unele programe sunt chiar capabile de a aranja textul pe coloane, imaginile și elementele non-textuale în pagină aproape identic cu sursa originală.
Vezi și
modificareLegături externe
modificare- ICDAR'07 Arhivat în , la Wayback Machine., ICDAR'09, o sursă cuprinzătoare despre aspectele recunoașterii scrisului din documente
- Linux OCR: Un studiu despre programele gratuite OCR Arhivat în , la Wayback Machine.
- 17 Things Arhivat în , la Wayback Machine. Explicarea principiului și istoriei recunoașterii scrisului de mână
- Materiale media legate de Recunoașterea optică a caracterelor la Wikimedia Commons