sudo apt install poppler-utils
pdfinfo
Informationen über eine PDF abrufen
pdfinfo dokument.pdf
pdffonts
Schriftarten, die innerhalb der PDF verwendet werden, abrufen
pdffonts dokument.pdf
pdftotext
Konvertiere PDF zu txt o.ä.
pdftotext dokument.pdf ausgabe.txt
| Option | Beschreibung |
-f Nr |
beginne auf Seite Nr |
-l Nr |
stoppe auf Seite Nr |
-htmlmeta |
erzeugt eine (einfache) HTML-Datei |
-enc TYP |
verwendet das Encoding TYP für die Textdatei |
-listenc |
zeigt alle mögliche Encodings (für -enc) an |
-eol TYP |
das Zeilenende in der Ausgabedatei wird auf TYP gesetzt (mögliche Werte: unix, dos, mac) |
pdftoppm
Konvertiere PDF zu ppm
pdftoppm dokument.pdf seite
seite ist dabei das Präfix für die Namen der Ausgabedateien. Hat eine PDF-Dokument z.B. drei Seiten, so werden die Dateien seite-000.ppm, seite-001.ppm und seite-002.ppm erzeugt. pdftoppm kennt einige Optionen, u.a. auch für das Ausgabeformat:
| Optionen von pdftoppm | |
| Option | Beschreibung |
-mono |
Ausgabe als monochrome PBM-Datei |
-gray |
Ausgabe als PGM-Datei (Grauskala) |
-png |
Ausgabe als PNG-Datei |
pdftohtml
Konvertiere PDF zu html
pdftohtml dokument.pdf seite
pdfimages
Extrahiere Bilder aus PDF
pdfimages dokument.pdf bild
bild ist dabei das Präfix für die Ausgabedatei(en). Enthält ein PDF z.B. drei Bilder, so werden die Dateien bild-000.ppm, bild-001.ppm und bild-002.ppm generiert. Über die Option -j werden alle im PDF-Dokument enthalten JPEG-Bilder auch als JPEG gespeichert und nicht als PPM.
pdfunite
Generiere eine PDF aus mehreren
pdfunite dokument1.pdf dokument2.pdf dokumentN.pdf Ausgabedokument.pdf