Riconoscimento Ottico dei Caratteri (OCR)

Riconoscimento Ottico dei Caratteri (OCR)

OCR è l’acronimo di riconoscimento ottico dei caratteri ed è una tecnologia che riconosce informatica che consente di convertire diverse forme di documenti, come immagini scannerizzate, foto o file PDF non modificabili, in testo digitale modificabile ed elaborabile da un computer.

Ad esempio il modulo di Uipath chiamato Document Understanding sfutta al meglio la tecnologia OCR riconoscere i tipi di documenti. Anche BD Robots ha creato un applicativo chiamto Oscar PDF in grado di leggere e riconoscere documenti PDF

L’OCR utilizza algoritmi di intelligenza artificiale per riconoscere i caratteri all’interno delle immagini, confrontandoli con set di caratteri noti e applicando tecniche di riconoscimento dei pattern.

Dopo che il testo è stato riconosciuto, il software OCR lo converte in un formato digitale, come un documento di testo o un foglio di calcolo, che può essere modificato, indicizzato, cercato o analizzato utilizzando altri software.

Il Riconoscimento Ottico dei Caratteri è ampiamente utilizzato in una varietà di applicazioni, tra cui la digitalizzazione di documenti cartacei, l’elaborazione automatizzata di fatture e l’estrazione di dati da immagini.

L’OCR è anche un componente chiave di molte soluzioni di Robotic Process Automation (RPA), ed è utilizzato per automatizzare i processi che richiedono l’estrazione di dati da documenti digitali.

 

 

Torna al Glossario