CLARC XTRACT Compiler

Verwendung

Der CLARC XTRACT Compiler ist ein Bestandteil von CLARC XTRACT.

Das Tool kann jedoch auch separat verwendet werden um Inhalte aus Images oder PDF's zu extrahieren.

Startparameter

Folgende Startparameter werden von diesem Tool unterstützt.

ParameterBeschreibungDatentypStandardOpt.
source Quelldatei (.pdf, .xps, .jpg, .tif).String

orgsourceQuelldatei (.pdf, .jpg, .tif).String

targetZieldatei (.xml oder .zip).String

objprocessingTyp der Objektaufbereitung (none oder advanced).StringadvancedX
pdfengineEngine zur Auswertung der Inhalte aus einem PDF (OrpalisGdPn11).StringOrpalisGdPn11X
readbarcodesGibt an ob Barcodes gelesen werden sollen.BooleantrueX
barcodesonlyEs wird ausschließlich eine Barcode-Erkennung durchgeführt.BooleanfalseX
ocrengineAuswahl der OCR Engine aus Tesseract, Transym, Nicomsoft oder FineReader.StringtesseractX
ocrlanguageAngabe der zu verwendenden OCR Sprache bzw. Lexikons. Die Sprache ist abhängig von der angegebenen Engine.String
X
pagelimitOptionale Beschränkung der zu erkennenden Seiten. Im Standard gibt es keine Beschränkung.Integer0X
barcodeparameterEine Beschreibung der Barcode-Parameter finden Sie hier unter Barcode Recognition Engine.


bc_minlengthMinimale Barcodelänge in Zeichen.Integer3X
bc_maxlengthMaximale Barcodelänge in Zeichen.Integer99X
bc_noisereduction0..1000Integer0X
bc_colorthreshold0..255Integer0X
bc:colorprocesslevel0..5Integer2X
bc_linejump0..1000Integer1X
bc_quietzonesize0..100Integer0 (Auto)X
bc_skewlinejump0..1000Integer0X
bc_skewtolerance5,13,21,29,37,45Integer5X
bc_scandirection
  • 1 - Left to Right
  • 2 - Top to Bottom
  • 4 - Right to Left
  • 8 - Bottom to Top
  • 16 - Top Left to Bottom Right
  • 32 - Top Right to Bottom Left
  • 64 - Bottom Right to Top Left
  • 128 - Bottom Left to Top Right
  • 255 - All Directions
Integer255X
bc_rangestart0..nInteger0X
bc_rangeend0..nInteger0X
bc_readmultiplebarcodestrue/falseBooleantrueX
bc_oversamplingtrue/falseBooleantrueX
bc_medianfiltertrue/falseBooleanfalseX
bc_convertupcetoean13true/falseBooleanfalseX
bc_checkcode25checksumtrue/falseBooleanfalseX
bc_checkcode39checksumtrue/falseBooleanfalseX
bc_checkcode39startstopchartrue/falseBooleantrueX
bc_code39errorcorrectiontrue/falseBooleanfalseX
bc_returncheckdigittrue/falseBooleanfalseX
bc_onlynumerictrue/falseBooleanfalseX
bc_code128true/falseBooleantrueX
bc_code25interleavedtrue/falseBooleantrueX
bc_code39true/falseBooleantrueX
bc_extendedcode39true/falseBooleantrueX
bc_codabartrue/falseBooleantrueX
bc_ean13true/falseBooleantrueX
bc_ean8true/falseBooleantrueX
bc_pdf_417true/falseBooleantrueX
bc_micropdf_417true/falseBooleanfalseX
bc_datamatrixtrue/falseBooleantrueX
bc_gs_1databartrue/falseBooleantrueX
bc_upc_atrue/falseBooleanfalseX
bc_upc_etrue/falseBooleanfalseX
bc_patchcodestrue/falseBooleanfalseX
bc_qrcodestrue/falseBooleanfalseX
waitWartet auf eine Tastatureingabe nach der Verarbeitung.BooleanfalseX
createlogLogdatei erstellen ja/nein.BooleanfalseX
logfileKompletter Pfad zur zu erzeugenden Logdatei.String
X

Technischer Bezeichner

cctextcompiler.exe