PDF erkunden

Die "PDF erkunden"-Funktion gibt einen Einblick in die interne Struktur der PDF-Dateien.
Für gwöhnlich ist dies nicht erforderlich, aber kann sehr hilfreich sein bei beschädigten Dateien oder falls Sie mehr Informationen über die interne Struktur einer PDF benötigen. Der Eintrag "PDF erkunden" ist zu finden unter "Zusatzmodule" von Acrobat ("pdfToolbox .. Sonstiges") oder dem "Werkzeuge"-Menü in der Standalone-Version.

Mit "PDF erkunden" bekommen Sie einen Einblick in die Datenstruktur einer PDF, gleichzeitig werden die einzelnen Befehle freigelegt und Details, welche die Seitenobjekte zusammenstellen.

Dokument Struktur Ansicht

Die erste Schaltfläche öffnet die "Document Structure"-Ansicht, welche 2 Objekte enthält:

  • Den document root "Catalog"

Das root eines Document Objektes ist das "Catalog"-Dictionary. Der Catalog enthält Referenzen zu anderen Objekten, die den Inhalt definieren, outlines, article threads, named destinations und andere Eigenschaften. Zusätzlich enthält es Informationen darüber, wie das Dokument auf dem Bildschirm angezeigt wird, sowie Informationen zu Lesezeichen und Vorschaubildern; ebenso ob statt der ersten Seite etwas anders angezeigt wird, wenn das Dokument geöffnet wird.

  • Die document info

Der document info Bereich listet einige grundlegende Informationen auf über die Datei, wie: Titel, Autor, Erstellungsdatum, Producer, Creator, Schlagwörter und so weiter..

Logische Struktur Ansicht

Während die Document Struktur Ansicht den vollständigen Inhalt darstellt, liefert die "Logical Structure"-Ansicht eher eine Seite-für-Seite Anzeige, der unterschiedlichen Eigenschaften einer Seite, wie etwa: Seitenrahmen, verwendete Ressourcen, Content Stream und mehr, ebenso wie andere optionale Merkmale etwa: Kommentare oder Vorschaubilder.

Unterschiedliche Ansichten des Content Streams

Die logische Struktur Ansicht bietet 4 unterschiedliche Representationen des Content streams:

  • Content Stream Snippets: erklärt
  • Content Stream Snippets: q/Q pairs
  • Content Stream Snippets: Marked content
  • Content Stream Snippets: text

Diese Ansichten können ausgewählt werden über die  4 farbigen Schaltflächen auf der rechten Seite der Auswahlleiste:

Content Stream Snippets: erklärt

Dieser Modus zeigt Kurzbeschreibungen für alle zeichnenden Sequenzen des content streams und macht es  so einfacher die Inhalte einer Seite zu verstehen wie diese Schritt für Schritt zusammengesetzt wird.

Content Stream Snippets: q/Q Paare

Die "q/Q pairs"-Ansicht zeigt den Content Stream in einer mehr reduzierteren Weise, da die zeichnenden Sequenzes hier sortiert sind nach ihrer graphic state Verschachtelung, auch bekannt als q/Q pairs.

Content Stream Snippets: Marked content

Die "Marked content"-Ansicht zeigt den Content Stream aus der tagging or marked content Perspektive, da der Content Stream gruppiert ist nach seinen entsprechenden BMC oder BDC Eigenschaften.

Content Stream Snippets: text

Die vierte Ansicht bietet eine reine Textansicht an des Content Streams in lesbarer Form.

Tagging Stucture Ansicht

Wenn eine PDF Datei tagging informationen enthält, gibt diese Ansicht einen detailierten Überblick über alle Details wie die ClassMap, eine strukturelle Ansicht von den verschiedenen Tags, ebenso wie weitere interessante Details.

Ressourcen Ansicht

Während die Logische Ansicht einen Überblick des Content Streams (neben Anderem) gibt, zeigt die "Resource"-Ansicht eine Seite-für-Seite Auflistung aller zeichnenden Objekte (wie Bilder, Verläufe, Texte, Vektor Objekte, ...).

Jede der Ressourcen hat eine spezifische untergeordnete Struktur mit weiteren Informationen. Außerdem werden alle Ressourcen aufgelistet, die auf der Seite verwendet werden, unabhängig davon, ob diese in den Seiten Ressourcen spezifiziert sind oder in Form XObject Ressourcen.

Der "Font"-Bereich ist besonders angereichert an Informationen, die aus der pdfToolbox Font Engine stammen.

Detailierte Glyph Informationen für eingebettete Schriften

Der Font-Bereich zeigt eingebettete und nicht-eingebettete Schriften, wie auch die unterschiedlichen Font-Typen. Das Ergebnis der Font-Engine ist verfügbar über den gesamten Font, wie auch für jeden einzelnen Glyphen und wird anhand einer Liste von Indikatoren hinter den entsprechenden Einträgen dargestellt.

Beim Auswählen eines Fonts, werden detailierte Informationen über den Font selbst sichtbar, wie auch über die enthaltenen Glyphen. Abhängig von der Markierung, ob die Auswahl auf der linken Seite getroffen wurde auf einer bestimmten Seite oder über "Analyze all pages", wird der Font entweder nur von der einen Seite oder des gesamten Dokumented angezeigt.

Für alle Glyphen eines eingebetteten Fonts gibt es einige Indikatoren hinter jedem Glypen. Wenn einer dieser Indikatoren rot erscheint, bedeutet das diese Eigenschaft auf den Glyph zutrifft. Dies muss nicht zwangläufig auf ein Problem hindeuten, es kann jedoch schnell die unterschiedlichen Eigeschaften der Glyphen darstellen.

In diesem Beispiel sind bei nahezu allen Glyphen ein großes "W", für einige Glyphen weitere "e" und "s" aktiv - und somit rot hervorgehoben. Der Bereich "Indicator lookup" beschreibt die einzelnen Indikatoren.

Eine Liste der verfügbaren Indikatoren lässt sich einsehen über "Indicator lookup". Bitte beachten Sie, das die Indikatoren einer bestimmten Reihenfolge unterliegen.

Die Indikator lookup Information gibt bei einem großen "W" an das die Glyphenweite verwende wird zu Positionierung (der Glyph wird nicht positioniert über Koordinaten, sondern anhand der Weite des vorausgegangenen Glyphen). "e" steht für Glyph ohne Kontour und "s" is für leere Glyphen Weite, so dass es sich bei diesem Glyphen voraussichtlich um ein Leerzeichen handeln muss.

Analysieren von Snippets und Export ausgewählter Snippets als neue PDF

Für jedes Objekt gibt es eine detailierte Ansicht, welche die zeichnenden und begrenzten Bereiche, den verwendeten Farbraum, ebenso wie eine Menge weiterer Informationen des aktuellen Extend GraphicState, eine mögliche verwendete Transformationsmatrix, bei Text den verwendeten Font und die Font-Größe, Überblendungsfarbraum, Überdruckenmodi und viel viel mehr..

Das "open snippet as PDF" Symbol oben in der Ressourcen Ansicht erlaubt ein neuerzeugen einer PDF aus der aktuellen Markierung in der linken Spalte. Die Auswahl kann auch mehrere Objekte und Filter enthalten und somit alle Objekte eines solchen Types beeinhalten. Solche PDF-Teile können verwendet werden zur weiteren Analyse und eine ursprünglich umfangreiche PDF weiter vereinfachen.

Die neue PDF wird separat geöffnet und kann verwendet werden zur weiteren Analyse der PDF.
Die Funktionsweise ist im Screenshot darüber rot umrandet dargestellt.

Verwendetes PDF Beispiel

Die angehängte Datei wurde verwendet um die verschiedenen Ansichten zu demonstrieren in "PDF erkunden".
Diese PDF wurde von der PDF Association erzeugt.