XMP Metadaten Berichte

Konfiguration

Die hier beschriebenen Methoden zur Konfiguration beziehen sich auf den XMP-Metadaten-Bericht, der sich über „Metadaten erkunden“ im Menü "Werkzeuge" beziehungsweise über die Switchboard-Aktion „Metadaten betrachten” erzeugen lässt.

Die Konfigurationsdatei ermöglicht dem Anwender, benannte Filter für XMP und andere Metainformationen einzurichten (z.B. DocInfo-Dictionary-Einträge oder Informationen direkt aus dem PDF-Dokument, wie etwa die Bildauflösung).

Der XMP-Metadaten-Bericht wird gemäß der Config-Datei als XML erstellt.

Dateiformat

Eine Konfigurationsdatei für einen Bericht (Report) muss als UTF-8-kodierte cfg-Datei gespeichert werden.

Einschränkungen

Für jedes Präfix, das in der Config-Datei für Include, Exclude oder GroupingKey verwendet wird, muss ein passender Namespace-Eintrag für die Definition des Namespace-URI in der Datei hinterlegt werden.

Beispielkonfiguration

Sie können für folgende Bereiche Beispielkonfigurationen im Verzeichnis "/var/Actions/Metadata/Filters/Export" ihrer CLI-Installation finden:

  • DublinCore
  • EXIF
  • General
  • IPTC
  • Photo
  • PLUS
  • Workflow

Elemente (Keys) für die Konfiguration

Die Konfigurationsdatei kann die folgenden Elemente (Keys) enthalten:

DisplayName

Ein einzelner Eintrag, der den Namen definiert, unter dem die Konfiguration angezeigt wird. Dieser muss genau einmal definiert werden.

DictFlag
0 = Name soll als String interpretiert werden,
1 = Name soll als dict key interpretiert werden
Title
if DictFlag = 1, Dict key für Display name-lookup (wird nicht bei implementierten Eigenschaften (Properties) angewendet)
if DictFlag = 0, der Display name
Beispiel

DisplayName

0

General

DisplayName

1

BOAGUI_MetaExpFilterDublinCore_long

Namespace

Definiert einen Namespace URI für die Verwendung im XMP-Metadaten-Report und verbindet diesen mit einem Namespace-Präfix und einem Schema-Namen. Dieser Key ist optional und kann mehrmals verwendet werden.

Prefix
Das Namespace Präfix, das für die Namespace-URI bevorzugt wird, zum Beispiel "dc"
Namespace URI
Der Namespace URI, zum Beispiel "http://purl.org/dc/elements/1.1/"
DictFlag
0 = Schema soll als String interpretiert werden,
1 = Schema soll als dict key interpretiert werden
Schema
Der Display Name für das Schema, das mit dem Namespace verbunden wird, zum Beispiel "Dublin Core"
Beispiel
Namespace dc http://purl.org/dc/elements/1.1/ 0 Dublin Core 

Eigenschaften

Definiert eine Namespace-Eigenschaft für die Verwendung im XMP-Metadaten-Bericht und verbindet diese mit einem Namespace-Präfix und einem Property-Name. Dieser Key ist optional und kann mehrmals verwendet werden.

Prefix
Namespace-Präfix, zum Beispiel "ptb_image"
Name
Property-Name, zum Beispiel "px_width"
DictFlag
0 = Label soll als String interpretiert werden,
1 = Label soll als dict key interpretiert werden
Label
Display-Name für die Property, zum Beispiel "Image width in pixels"
Beispiel
Property ptb_document file 0 File Name 

GroupingKey

Definiert die Gruppierung der XML-Reports. Für jeden Eigenschaften-Werte-Typ im Namespace, der mit dem Präfix verbunden ist, wird ein bestimmter XMP-Metadaten-Report erstellt. Dieser enthält nur Elemente mit demselben Wert für prefix/property, die im „include“-Satz definiert werden. Dieser Key ist optional und darf nicht mehr als einmal verwendet werden.

Type
Spezifiziert, für welche Objekte im PDF-Dokument der Grouping Key gesucht beziehungsweise angewendet werden soll
Mögliche Werte sind Document, Page, Image
Prefix
Der Namespace-Präfix
Muss in der Namespace Definition erfasst werden
Property
Die XMP-Eigenschaft im Namespace für das Report Grouping, die über das Präfix identifiziert wird
Beispiel
GroupingKey Image xmpRights Owner 

Include

Eine Whitelist. Alle Metadaten, die einem Eintrag in dieser Liste entsprechen, und die nicht über das Exclude Statement ausgeschlossen wurden, werden exportiert. Dieser Key sollte zumindest einmal verwendet werden, damit überhaupt ein Report erstellt wird; der Key kann mehrmals verwendet werden.

Type
Spezifiziert, auf welche Objekte im PDF-Dokument dieses Include Statement angewandt wird
Mögliche Werte sind Document, Page, Image, *
Hinweis: * wird als Wildcard für alle Typen verwendet
Prefix
Der Namespace Prefix
Muss in der Namespace Definition eingefügt werden
Hinweis: * wird als Wildcard für alle Präfixes verwendet
Property
Die XMP-Eigenschaft im Namespace zum Zweck einer Übereinstimmung vom Präfix identifiziert
Hinweis: * wird als Wildcard für Übereinstimmungen bezüglich der Eigenschaften verwendet
Beispiel
Include Image ptb_image thumbnail 

Exclude

Eine Blacklist. Alle Metadaten, die einem Eintrag entsprechen, werden nicht exportiert, dieser Key ist optional und kann mehrmals verwendet werden.

Type
Legt fest, für welche Objekte im PDF-Dokument dieses Include Statement angewandt werden soll
 Mögliche Werte sind Document, Page, Image, *
 Hinweis: * wird als Wildcard verwendet und trifft auf alle Typen zu
Prefix
Der Namespace Präfix
Muss in der Namespace Definition eingeschlossen sein
Hinweis: * wird als Wildcard verwendet und trifft auf alle Präfixes zu
Property
Die XMP-Eigenschaft, die im Namespace für die Übereinstimmung durch den Prefix festgelegt wird
Hinweis: * wird als Wildcard verwendet und trifft auf alle Eigenschaften zu
BeispieL
Exclude Document dc title 

Filtersortierung

Filter werden in der folgenden Reihenfolge ausgeführt:

GroupingKey nicht vorhanden

Schließe alle folgenden Elemente ein

  • Übereinstimmung mit mindestens einem Element der Whitelist (Include key)
  • und Übereinstimmung mit keinem Element in der Blacklist (Exclude key)

GroupingKey vorhanden

Für jeden Wert der XMP-Metadaten-Eigenschaften, wie sie im GroupingKey definiert ist, wird ein eigener Report mit Elementen erstellt, die

  • eine XMP-Metadaten-Eigenschaft gemäß GroupingKey-Definition haben (z.B. „Image“), die einen Wert gemäß GroupingKey-Definition hat (z.B. „xmpRights“)
  • und mindestens einem Eintrag aus der Whitelist entsprechen (Include Key)
  • und keinem Eintrag aus der Blacklist entsprechen (Exclude Key)

Handhabung von Nicht-XMP-Metadaten

In pdfaPilot und pdfToolbox gibt es einige zusätzliche Namespaces und Eigenschaften.

DocInfo Dictionary

Namespace URI

http://www.callassoftware.com/ns/pdfaPilot2/1.0/metadatareport/docu-­ment

Namespace URI

http://www.callassoftware.com/ns/pdfToolbox4/1.0/metadatareport/docu-­ment

Preferred prefix

ptb_document

Verfügbare Eigenschaften

DocInfo_<key>

Document info entry <key>

<key> muss einer der folgenden PDF document info dictionary keys sein:

CreationDate
Das Datum, an dem das PDF-Dokument erstellt wurde
ModDate
Das Datum, an dem das PDF-Dokument zuletzt geändert wurde
Creator
Das Programm, in dem das Originaldokument erstellt wurde
Producer
Das Programm, über das die PDF-Datei produziert wurde
Title
Der Dokumenttitel
Subject
Das Thema des Dokuments
Keywords
Stichwörter für das Dokument
Trapped
Der Überfüllungsschlüssel
PageMode
Der Modus, in dem das Dokument beim Öffnen angezeigt werden soll (z.B. "UseOutlines")
PageLayout
Die Art, wie Seiten nach dem Öffnen angezeigt werden (z.B. "SinglePage")
PdfXVersion
Die PDF/X Version (z.B. PDF/X-1a)
PdfXConformance
Der PDF/X-Level (z.B. 1a)
PdfE1Version
Die PDF/E-Version
Beispiel
Property ptb_document DocInfo_Creator 0 Creator 

Bildeigenschaften

Namespace URI

http://www.callassoftware.com/ns/pdfaPilot2/1.0/metadatareport/image

Namespace URI

http://www.callassoftware.com/ns/pdfToolbox4/1.0/metadatareport/image

Preferred prefix

ptb_image

Verfügbare Eigenschaften
px_width
Breite des Bildes in Pixel
px_height
Höhe des Bildes in Pixel
ppi_horizontal
Horizontale Auflösung in ppi
ppi_vertical
Vertikale Auflösung in ppi
left
Versatz des linken Bildrandes in pt (relativ zur CropBox)
right
Versatz des rechten Bildrandes in pt (relativ zur CropBox)
top
Versatz des oberen Bildrandes in pt (relativ zur CropBox)
bottom
Versatz des unteren Bildrandes in pt (relativ zur CropBox)
pt_llx
Quad-Point Lower Left x in Pt
pt_lly
Quad-Point Lower Left y in Pt
pt_ulx
Quad-Point Upper Left x in Pt
pt_uly
Quad-Point Upper Left y in Pt
pt_urx
Quad-Point Upper Right x in Pt
pt_ury
Quad-Point Upper Right y in Pt
pt_lrx
Quad-Point Lower Right x in Pt
pt_lry
Quad-Point Lower Right y in Pt
pt_width
Breite des Bildes in Pt
pt_height
Höhe des Bildes in Pt
thumbnail
Bildvorschau
Beispiel
Property ptb_image px_height 0 Image height in pixel 

Seiteneigenschaften

Namespace URI

http://www.callassoftware.com/ns/pdfaPilot2/1.0/metadatareport/page

Namespace URI

http://www.callassoftware.com/ns/pdfToolbox4/1.0/metadatareport/page

Preferred prefix

ptb_page

Verfügbare Eigenschaften
nr
Nummer der Seitenabfolge (’1’ basecd)
cropbox_width
CropBox Breite
cropbox_height
CropBox Höhe
cropbox_left
CropBox links
cropbox_right
CropBox rechts
cropbox_top
CropBox oben
cropbox_bottom
CropBox unten
thumbnail
Seitenvorschau
Beispiel
Property ptb_page cropbox_top 0 Cropbox top