Tesseract, un valido OCR per Ubuntu

Categoria:
Software
Shortlink:
wp.me/p4yd8-xz

Oggi dovevo correggere un testo dattiloscritto e anziché riscriverlo a mano ovviamente ho pensato di utilizzare un sistema di Optical Character Recognition, che onestamente su Linux non ho mai usato. Una rapida occhiata al Wiki e ho trovato il consiglio: usare Tesseract. Si è comportato molto bene: se potessi votarlo darei un bel 9+. Essendo un fax, il testo non era per niente di alta qualità, ma seguendo i consigli della pagina citata circa le modifiche da apportare al file, Tesseract ha convertito un’immagine in testo editabile e con errori prossimi allo zero. Consigliato.

Per nota personale mi appunto quel che ho fatto:

sudo apt-get install tesseract-ocr-eng tesseract-ocr-ita

Quindi ho modificato l’immagine, ne ho cambiato la modalità a Indicizzata a 1 bit e l’ho salvata in TIF. Poi il fatidico comando:

tesseract input.tif output -l ita

7 commenti a “Tesseract, un valido OCR per Ubuntu”

  1. Mistya scrive:

    Negli ultimi 20 giorni tesseract mi ha salvato la vita. Stavo per l’appunto pensando ad un post sul mio blog per celebrarlo..

    Non sarebbe bello se si potesse fare una gui? Al massimo io saprei farla per BUC ma non è il massimo.

    • Aldo scrive:

      Guarda, l’ho usato solo una volta e mi è bastato quel semplice comando: da GUI dovresti fare non so quanti clic prima di arrivare al risultato. Non è più comodo da terminale?

      Una GUI, invece, la gradirei se Tesseract avesse più funzioni, laddove quindi dovrei mettere più parametri nel terminale.

  2. Mistya scrive:

    Beh, pensa una gui in cui poter selezionare diverse immagini alla volta e con un solo click dirgli di:
    Trasformarle in .tif da 1bit
    Tradurle
    Integrarle nello stesso documento invece che in tanti .doc per quenti sono i file originali..

    Ecco, per questo pensavo ad una gui

  3. Mavi scrive:

    Grazie per questo utilissimo post :smile:
    Ho installato tesseract e gscan2pdf anche su Fedora.
    Quanto tempo risparmiato…Grazie ancora

Lascia un commento

La tua email non verrà mai resa pubblica. I campi obbligatori sono marcati con *.

Linee guida per il commento.
Se hai una richiesta di supporto tecnico, serviti del forum.

Sorriso Occhiolino Compiaciuto Soddisfatto Risata Figo Bacio Linguaccia Innocente Neutrale Indeciso Mr. Green! Imbarazzato Triste Preoccupato Shock Piange Arrabbiato Cattivo Scimmia Idea! Domanda Importante Freccia

Feed RSS dei commenti all'articolo.

Iscriviti senza lasciare un commento