PDF via Terminal

sudo apt install poppler-utils

pdfinfo

Informationen über eine PDF abrufen

pdfinfo dokument.pdf

pdffonts

Schriftarten, die innerhalb der PDF verwendet werden, abrufen

pdffonts dokument.pdf

pdftotext

Konvertiere PDF zu txt o.ä.

pdftotext dokument.pdf ausgabe.txt
Option Beschreibung
-f Nr beginne auf Seite Nr
-l Nr stoppe auf Seite Nr
-htmlmeta erzeugt eine (einfache) HTML-Datei
-enc TYP verwendet das Encoding TYP für die Textdatei
-listenc zeigt alle mögliche Encodings (für -enc) an
-eol TYP das Zeilenende in der Ausgabedatei wird auf TYP gesetzt (mögliche Werte: unix, dos, mac)

pdftoppm

Konvertiere PDF zu ppm

pdftoppm dokument.pdf seite

seite ist dabei das Präfix für die Namen der Ausgabedateien. Hat eine PDF-Dokument z.B. drei Seiten, so werden die Dateien seite-000.ppm, seite-001.ppm und seite-002.ppm erzeugt. pdftoppm kennt einige Optionen, u.a. auch für das Ausgabeformat:

Optionen von pdftoppm
Option Beschreibung
-mono Ausgabe als monochrome PBM-Datei
-gray Ausgabe als PGM-Datei (Grauskala)
-png Ausgabe als PNG-Datei

pdftohtml

Konvertiere PDF zu html

pdftohtml dokument.pdf seite

pdfimages

Extrahiere Bilder aus PDF

pdfimages dokument.pdf bild

bild ist dabei das Präfix für die Ausgabedatei(en). Enthält ein PDF z.B. drei Bilder, so werden die Dateien bild-000.ppm, bild-001.ppm und bild-002.ppm generiert. Über die Option -j werden alle im PDF-Dokument enthalten JPEG-Bilder auch als JPEG gespeichert und nicht als PPM.

pdfunite

Generiere eine PDF aus mehreren

pdfunite dokument1.pdf dokument2.pdf dokumentN.pdf Ausgabedokument.pdf

s. https://wiki.ubuntuusers.de/poppler-utils/