Vi presentiamo Tesseract-GUI software per il riconoscimento ottico dei caratteri (OCR) in Ubuntu Linux e derivate.

Tesseract-GUI in Ubuntu
Nei repository ufficiali delle principali distribuzioni Linux troviamo anche Tesseract-OCR, potente strumento a riga di comando dedicato al riconoscimento ottico dei caratteri (OCR). Sviluppato inizialmente da HP, Tesseract-OCR ci consente di trasformare una normale un’immagine contenente del testo (molto spesso importata da uno scanner) in un normale documento di testo che possiamo editare ad esempio con Gedit, LibreOffice ecc. Operare da riga di comando non è un’operazione molto amata soprattutto da nuovi utenti, per questo motivo è nato Tesseract-GUI software open source che fornisce una completa interfaccia grafica di Tesseract-OCR.

Tesseract-GUI ci consente di operare in una o più immagini con la possibilità di elaborare l’intera foto digitale oppure solo una parte. Consente il supporto per più lingue e diverse opzioni come il zoom e rotazione dell’immagine, miglioramento del contrasto e filtro antirumore e la possibilità di salvare il tutto in un file di testo predefinito.

Semplice e davvero molto utile Tesseract-GUI è un’ottimo software per il riconoscimento ottico dei caratteri (OCR) che richiede pochissimi mb di RAM e può funzionare in qualsiasi ambiente desktop. Grazie al pacchetto creato da noi, avremo già a disposizione il supporto per la lingua italiana e inglese oltre ad importare i più diffusi formati di immagini digitali come jpeg, png ecc.

Tesseract-GUI in Ubuntu

– Installare Tesseract-GUI

Tesseract-GUI è disponibile per Ubuntu e derivate scaricando il pacchetto deb da questa pagina. Per Debian Stabile (e derivate) basta installare il pacchetto per Ubuntu 12.04 Precise mentre per Debian Testing e SID possiamo installare il pacchetto per Ubuntu 14.04 Trusty LTS.

Una volta scaricato il pacchetto deb basta dare un doppio click su di esso e confermare l’installazione, al termine basta avviare il software da menu.

Se dobbiamo effettuare la scansione OCR di libri antichi in italiano consiglio di installare il pacchetto tesseract-ocr-ita-old digitando da terminale:

sudo apt-get install tesseract-ocr-ita-old 

e confermiamo.

Tesseract-GUI è disponibile anche per Arch Linux attraverso AUR.

Home Tesseract-GUI

  • LORENZO “LOLLO” SPADONI

    Carino, peccato che non esista il pacchetto per Slackware, pazienza! Me lo farò da solo!

    Hello! 🙂

  • gabriele

    attualmente uso http://sourceforge.net/projects/gimagereader/ … che da la possibilità di editare il testo scansionato prima di salvare. Proverò comunque anche questo …

    • Clippy

      È sempre basato su tesseract, non ha un motore diverso.

  • Gustavo

    bella la gui.. che sia potente tesseract proprio no..

    • .theShort

      Quoto, Tesserac è proprio scarso nel riconoscimento ocr… 🙁
      Purtroppo nel mondo open/Linux mancano ancora valide alternative per l’ocr.

      • Ermy_sti

        perchè dici che è scarso? nel 1995 era stato uno dei 3 migliori motori e negli ultimi anni migliorato da google..non l ho mai usato ma non dovrebbe essere male

  • CF

    Grazie 🙂

No more articles