Prozessplan: Text mit Hilfe von OCR exportieren
Dieser Prozessplan erzeugt ORC-Text auf allen Seiten und extrahiert den Text in eine .txt-Datei neben der Eingabedatei.
Die früheste Version mit voller Unterstützung für „Text mit Hilfe von OCR exportieren.kfpx“ ist pdfToolbox 15.
- Um die Qualität des OCR-Textes sicherzustellen, wird der vorhandene OCR-Text gelöscht.
- Die Seite wird in ein Bild konvertiert.
- Neuer OCR-Text wird für alle Seiten erstellt.
- Der Text wird in eine .txt-Datei extrahiert, die neben der Eingabedatei gespeichert wird.
- Nachdem die Engine den OCR-Text in eine Textdatei extrahiert hat, wird die Originaldatei wiederhergestellt.
Da der letzte Schritt im Prozessplan ein „Datei aufgreifen“ Schritt ist, bedeutet dies, dass die Originaldatei wiederhergestellt wird. Daher ist es nicht notwendig, das Ergebnis zu speichern. In diesem Fall kann die Checkbox „Veränderte Eingangsdatei nicht speichern“ in den Prozessplanparametern aktiviert werden, um den Dialog „Speichern unter“ zu unterdrücken.