Vi presentiamo Tesseract-GUI software per il riconoscimento ottico dei caratteri (OCR) in Ubuntu Linux e derivate.

Tesseract-GUI in Ubuntu
Nei repository ufficiali delle principali distribuzioni Linux troviamo anche Tesseract-OCR, potente strumento a riga di comando dedicato al riconoscimento ottico dei caratteri (OCR). Sviluppato inizialmente da HP, Tesseract-OCR ci consente di trasformare una normale un’immagine contenente del testo (molto spesso importata da uno scanner) in un normale documento di testo che possiamo editare ad esempio con Gedit, LibreOffice ecc. Operare da riga di comando non è un’operazione molto amata soprattutto da nuovi utenti, per questo motivo è nato Tesseract-GUI software open source che fornisce una completa interfaccia grafica di Tesseract-OCR.

Tesseract-GUI ci consente di operare in una o più immagini con la possibilità di elaborare l’intera foto digitale oppure solo una parte. Consente il supporto per più lingue e diverse opzioni come il zoom e rotazione dell’immagine, miglioramento del contrasto e filtro antirumore e la possibilità di salvare il tutto in un file di testo predefinito.

Semplice e davvero molto utile Tesseract-GUI è un’ottimo software per il riconoscimento ottico dei caratteri (OCR) che richiede pochissimi mb di RAM e può funzionare in qualsiasi ambiente desktop. Grazie al pacchetto creato da noi, avremo già a disposizione il supporto per la lingua italiana e inglese oltre ad importare i più diffusi formati di immagini digitali come jpeg, png ecc.

Tesseract-GUI in Ubuntu

– Installare Tesseract-GUI

Tesseract-GUI è disponibile per Ubuntu e derivate scaricando il pacchetto deb da questa pagina. Per Debian Stabile (e derivate) basta installare il pacchetto per Ubuntu 12.04 Precise mentre per Debian Testing e SID possiamo installare il pacchetto per Ubuntu 14.04 Trusty LTS.

Una volta scaricato il pacchetto deb basta dare un doppio click su di esso e confermare l’installazione, al termine basta avviare il software da menu.

Se dobbiamo effettuare la scansione OCR di libri antichi in italiano consiglio di installare il pacchetto tesseract-ocr-ita-old digitando da terminale:

sudo apt-get install tesseract-ocr-ita-old 

e confermiamo.

Tesseract-GUI è disponibile anche per Arch Linux attraverso AUR.

Home Tesseract-GUI

No more articles