web analytics

Linux: Estrarre le immagini da un PDF direttamente da terminale

Abbiamo visto nei giorni scorsi come possiamo, con facilità, convertire una semplice pagina web in documento PDF. Utile per salvarci guide dal web (esempio la guida per l’installazione di Arch Linux) oppure articoli da leggere con tranquillità quando siamo offline.
Oggi vedremo un’altra interessante funzionalità, come estrarre immagini da un documento PDF. Se un nostro amico, collega ecc ci ha inviato un documento PDF dal quale vogliamo estrarne le immagini possiamo farlo con molta facilità il tutto direttamente da terminale.
Per far tutto questo utilizzeremo un tool che fa il contrario di wkhtmltopdf ossia crea un html da un documento PDF in modo tale che ne estrarrà le immagini per poi realizzare la pagina web.
Per convertire un PDF in Html utilizzeremo un semplice tool a riga di comando denominato poppler-utils.
Poppler è un tool presente nelle principali distribuzioni Linux per installarlo basta digitare da terminale:

Per Ubuntu, Debian e derivate

sudo apt-get install poppler-utils

Per Fedora

sudo yum install poppler-utils

Per openSUSE

sudo zypper install poppler

Per Arch Linux

sudo pacman -Sy poppler

una volta installato Poppler basta copiare il documento PDF nella home e digitare il seguente comando:

pdftohtml documento.pdf documento.html

esempio per lffl.pdf:

pdftohtml lffl.pdf lffl.html

pdftohtml

al termine dell’operazione avremo le immagini dei PDF estratte nella nostra home.