OCR sono quelli del riconoscimento ottico dei caratteri o anche conosciuti in spagnolo come riconoscimento ottico dei caratteri .L'OCR è un software che consente il riconoscimento del testo, producendo un'immagine di esso per trasformarlo in una successione di caratteri , quindi salvarli in un determinato formato, che può essere utilizzato in quei programmi di modifica del testo.Vale a dire che grazie a questa nuova tecnologia è possibile convertire qualsiasi tipo di testo o documento , che copre file PDF, documenti scansionati o persino immagini tratte da fotocamere digitali, nei dati per avere la possibilità di essere modificati.
Questo software funziona come segue, prima analizzare ogni parte dell'immagine del documento in questione ; distribuire la pagina in pezzi come tabelle, immagini, blocchi di testo tra gli altri; quindi le linee sono distribuite in parole e poi diventano caratteri; e poiché i personaggi erano già stati indicati, il software fa il confronto con un gruppo di immagini del modello.Questo avanza secondo la serie di ipotesi su ciò che ciascun personaggio è ; e sulla base di queste ipotesi, analizza le diverse varianti di linee spezzate in parole e parole in caratteri.Ed è dopo un gran numero di analisi ed elaborazione delle ipotesi, che finalmente il programma presenta il testo già riconosciuto e trasformato con un nuovo formato .
Va notato che oggi esistono numerosi programmi offerti dal mercato IT basati su OCR come OmniPage, Abbyy Fine Reader o READiris .YY che hanno la capacità, non solo di analizzare e riconoscere un testo in quanto tale, ma riconosce anche il formato e lo stile , ma con alcune limitazioni, necessitando quindi del testo, dopo essere analizzato, modificato per apportare le modifiche necessarie.
Commenti
Posta un commento