Funktion

Die Readable PDF Conversion Engine konvertiert Bilddateien und imagebasiert PDF's in durchsuchbare PDF's. Dabei wird der Inhalt über eine OCR Engine ausgelesen und in der erkannte Text als zusätzliche Ebene in das PDF eingefügt.

OCR-Engines

Als Auswahl stehen verschiedene OCR Engines zur Verfügung:

Tesseract
Transym
Nicomsoft
Finereader

Hinweis

Bitte beachten Sie, dass Transym und Finereader eine zusätzliche Lizenzierung benötigen. Die Tesseract und Nicomsoft Engine ist immer vollumfänglich verwendbar.

Bei der Auswahl der OCR Engine muss abhängig dazu eine entsprechende Sprache angegeben werden um möglichst ideale Ergebnisse zu erzielen. Eine Ausnahme ist hierbei die Transym Engine - diese basiert auf einer anderen Technologie und benötigt daher keine Angabe einer Sprache.

Die Auswahl der Engine beeinflusst die Erkennungsqualität und Erkennugsdauer.

Optional kann die Ausgabedatei als PDF/A erzeugt werden.

Lesezeichen

Mit der Bookmarks Funktion können im PDF Dokument automatische Lesezeichen erstellt werden. Diese bestehen aus den ersten n Zeichen des erkannten OCR Textes und der Angabe Page description - also Seitenbeschreibung.

Nested Bookmarks erzeugt eingerückte Lesezeichen. Reine Geschmackssache...

Steuerfelder

Über die Steuerfelder können wichtige Informationen an die Engine übergeben werden.
Beispielesweise die OCR Sprache (OCRLANGUAGE) oder Informationen zum PDF Ersteller wie PDFDOCAUTHOR.

Alle Details finden Sie auf dem Reiter Info in der Engine.

Konfigurationsoptionen

Option	Beschreibung
Basics
OCR engine	Auswahl der zu verwendenden OCR Engine: Transym (TOCR) Tesseract Nicomsoft Finereader
OCR language	Gibt die zu verwendende OCR Sprache an (Wörterbuch). Bei Transym muss keine OCR Sprache angegeben werden, da hier ein anderes Verfahren Anwendung findet.
Create PDF/A	Das erzeugte PDF wird im PDF/A Standard erstellt.
Advanced
Create PDF/A	Auswahl der Komprimierung im PDF/A Format
JPG Compression	Auswahl der Komprimierungsrate über den Slider für JGP Dateien
JPC 2000 Compression	Auswahl der Komprimierungsrate über den Slider für JGP 2000 Dateien
Bookmarks
Create bookmarks	Erstellt ein Inhaltsverzeichnis im PDF aus den OCR Daten.
Create nested bookmarks	Das Inhaltsverzeichnis wird strukturiert in Untergruppen dargestellt.
Page description	Name der "Seite" für das Inhaltsverzeichnis - siehe "nested bookmarks".
Bookmark length	Die Länge des Textes der aus der OCR Erkennung für das Inhaltsverzeichnis herangezogen werden soll. Ungültige Zeichen werden herausgefiltert.

Technische Bezeichnung

ccreadablepdfconversion.dll

READABLE PDF Conversion Engine

Funktion

OCR-Engines

Lesezeichen

Steuerfelder

Konfigurationsoptionen

Basics

Advanced

Bookmarks

Technische Bezeichnung