Text suchen

Die Prüfeigenschaft "Text auf Seite" identifiziert Seiten, ob sie einen bestimmten Text enthalten oder nicht. Bitte beachten Sie, dass diese Eigenschaft nicht mit anderen Objekteigenschaften kombiniert werden kann.

Die Textsuche erfolgt auf der Grundlage der pdfToolbox-Aktion --extracttext, die Text aus einer PDF-Datei extrahiert.

Anwendung

  1. Übereinstimmende Kriterien: Der Text kann anhand verschiedener Suchkriterien aus dem Dropdown-Menü gesucht werden (einige Beispiele unten): 
    • beginnt mit
    • beginnt nicht mit
    • enthält Text mit RegEx
    • endet mit
    • gleich
    • entspricht RegEx-Ausdruck
    • ...
  2. Zu suchender Text: Auf der Grundlage der Übereinstimmungskriterien ist hier der zu suchende Text einzugeben.
  3. Suche in benutzerdefiniertem Bereich: Definiert die Position, an der der Text gesucht werden soll. Wichtig: Wenn Sie auf der gesamten Seite suchen möchten, muss die Checkbox deaktiviert werden.
  4. Wenn nur an einer bestimmten Position auf der Seite nach Text gesucht werden soll, kann hier ein benutzerdefinierter Bereich definiert werden. Positive und negative Zahlen sind erlaubt. Wird bei "Breite" oder "Höhe" eine 0 (Null) eingegeben, wird dies als "kein Wert" interpretiert und die ursprüngliche Breite und Höhe der Seitenbox bleibt erhalten.
  5. Einheit: Bestimmt die "Einheit" der benutzerdefinierten Seitenabmessungen in
    • Zentimeter
    • Millimeter
    • Inch
    • Punkt
    • Pica

In den Triggerwerten des jeweiligen Treffers kann der gefundene Text eingesehen werden. Die oben gezeigte Prüfung verwendet einen Regex, der jeden Text findet der die Zahl 1, 2 oder 3 sowie den Buchstaben a, b oder c verwendet.

Bei der Auswahl des Operators für ein Suchkriterium, ist eine sorgfältige Abwägung erforderlich. 

Ein Beispiel: Für das Suchwort 'Black' in einer PDF-Datei wird ein Regex 'Ba*' definiert und der Operator:'Enthält Text mit Regex': ergibt einen Treffer.

'Entspricht Regex': ergibt keinen Treffer, da der Regex nicht vollständig dem Wort 'Black' entspricht.

Diese Prüfeigenschaft kann mit der Aktion (und dem entsprechenden CLI-Parameter) 'PDF an Markierung teilen'/--splitatmark verwendet werden.