XTRACT Compiler Merge Definitionen
- Former user (Deleted)
XTRACT Compiler Merge Definitionen
Merge-Definitionen dienen der Erkennung von bestimmten Objekteigenschaften wie zum Beispiel der Zuordnung eines Inhalts zu einer Umsatzsteuer-Identifikationsnummer. Wie der Name schon andeutet kann über diese Funktion auch eine Reihe von Objekten zu einem einzelnen Objekt zusammengeführt werden.
Für diese Aufgabenstellung stehen dem Entwickler eine Vielzahl von Konfigurations- und auch Scriptingmöglichkeiten zur Verfügung, welche wir Ihnen hier erläutern möchten.
Property | Type | Beschreibung | Beispiel |
---|---|---|---|
Active | BOOLEAN | Aktiviert oder Deaktiviert die Merge-Definition | True |
AttributeRequirements | UCS4STR | Ein Set an Attributeigenschaften welche für die zu betrachtenden Objekte gegeben sein müssen um für den Merge relevant zu sein:
| [ccEA_Numeric, ccEA_StrictInteger] |
AutoKeyWords | BOOLEAN | Aktiviert oder deaktiviert die Erzeugung der automatischen Schlüsselwortbildung - abhängig von den definierten Listen (Suffixes, Prefixes) für den entsprechenden MainType. | True |
DataType | UCS4STR | Überschreibt die angegebene Standard-Definition (siehe XTRACT Compiler Standards) oder definiert eine neue eigenständige Definition - siehe Property UserDataType. | ccDT_Identifier_VAT |
Description | UCS4STR | Beschreibungstext für Dokumentationszwecke. | Example Definition |
ExclusionRegEx | UCS4STR | RegEx zum Ausschluss eines bestimmten Begriffs. | |
FinalAttributeRequirements | UCS4STR | Ein Set an Attributeigenschaften welche für das finale Objekte gegeben sein müssen - siehe Property AttributeRequirements. | [ccEA_Numeric, ccEA_StrictInteger] |
KeyWordAccurracy | SINGLE | Definiert die Genauigkeit mit der ein Schlüsselwort gefunden bzw. festgelegt werden kann. KeyWordAccurracy ist ein Float Wert zwischen 0 und 1. Bei einer Angabe von 0 wird eine automatische Genauigkeit auf Grund von verschiedenen Faktoren herangezogen. | 0.00 |
KeyWordPositions | UCS4STR | Definiert ein Set in welcher Relation sich das Schlüsselwort zum gesuchten Objekt befindet. Dabei sind folgende Attribute möglich:
| [ccRP_Left, ccRP_Above] |
KeyWords | UCS4STR | Eine Liste von möglichen Schlüsselbegriffen mit einem Zeilenumbruch getrennt. Siehe auch AutoKeyWords Property. | VAT UMSATZSTEUER |
MaxDistanceFactor | SINGLE | MaxDistanceFactor beschreibt den Faktor um wie weit sich ggf. zusammengehörige Objekte voneinander entfernt befinden können, abhängig von der Größe eines einzelnen Zeichens eines Elements. Im Standard ist es der Wert 1. Bei 2 bedeutet dies, dass sich ein Objekt maximal 2xZeichenlänge entfernt befinden darf um noch als relevant für einen Merge gesehen zu werden. | 1.5 |
MaxLength | INT | Gibt die maximale Länge des finalen Objekts an. Dient vor allem der Performance-Optimierung um RegEx Durchläufe zu optimieren. | 10 |
MergeConditions | UCS4STR | Durch das Set an Merge Bedingungen wird festgelegt durch welche Methoden zusammengehörige Elemente gefunden werden sollen:
| [ccMC_CompileElementsByRegEx, ccMC_UppercaseRegExCheck] |
MergeModifiers | UCS4STR | Die MergeModifiers sind ein Set über das bestimmt wird unter welchen Bedingungen die gefundenen Elemente zusammengeführt werden bzw. wie diese inhaltlich angepasst werden sollen:
| [ccMM_UpperCase] |
MinLength | INT | Gibt die minimale Länge des finalen Objekts an. Dient vor allem der Performance-Optimierung um RegEx Durchläufe zu optimieren. | 5 |
PageArea | UCS4STR | Definiert ein Set in welchem Bereich einer Seite nach den Schlüsselwörtern gesucht werden soll:
| [ccPA_UpperThird, ccPA_LowerThird] |
ProcessPriority | UCS4STR | Definiert die Priorität mit welcher die Definition in Relation zu allen anderen angewendet werden soll:
| ccPP_High |
Script | UCS4STR | Direkter Sourcecode zur Ermittlung. Kein C4 Link. | |
UserDataType | UCS4STR | Benutzerdefinierter Datentyp. DataType = ccDT_Userdefined | TestMerge |
ValidationRegEx | UCS4STR | RegEx zur Prüfung des finalen Ergebnisses eines Merge. |
Beispiel ccDT_Identifier_VAT
Property | Type | Beispiel |
---|---|---|
Active | BOOLEAN | True |
AttributeRequirements | UCS4STR | [] |
AutoKeyWords | BOOLEAN | True |
DataType | UCS4STR | ccDT_Identifier_VAT |
Description | UCS4STR | |
ExclusionRegEx | UCS4STR | |
FinalAttributeRequirements | UCS4STR | [] |
KeyWordAccurracy | SINGLE | 0.00 |
KeyWordPositions | UCS4STR | [ccRP_Left, ccRP_Above] |
KeyWords | UCS4STR | UST |
MaxDistanceFactor | SINGLE | 2.10 |
MaxLength | INT | 20 |
MergeConditions | UCS4STR | [ccMC_CompileElementsByRegEx, ccMC_IgnoreSeparators, ccMC_UppercaseRegExCheck] |
MergeModifiers | UCS4STR | [ccMM_UpperCase, ccMM_RemoveDashes] |
MinLength | INT | 8 |
PageArea | UCS4STR | [ccPA_FullPage] |
ProcessPriority | UCS4STR | ccPP_High |
Script | UCS4STR | |
UserDataType | UCS4STR | |
ValidationRegEx | UCS4STR | (AT)U[0-9]{8}|(BE)0[0-9]{9}|(BG)[0-9]{9,10}|(CY)[0-9]{8}L|(CZ)[0-9]{8,10}|(DE)[0-9]{9}|(DK)[0-9]{8}|(EE)[0-9]{9}|(EL|GR)[0-9]{9}|(ES)[0-9A-Z][0-9]{7}[0-9A-Z]|(FI)[0-9]{8}|(FR)[0-9A-Z]{2}[0-9]{9}|(GB)([0-9]{9}([0-9]{3})?|[A-Z]{2}[0-9]{3})|(HU)[0-9]{8}|(IE)[0-9]S[0-9]{5}L|(IT)[0-9]{11}|(LT)([0-9]{9}|[0-9]{12})|(LU)[0-9]{8}|(LV)[0-9]{11}|(MT)[0-9]{8}|(NL)[0-9]{9}B[0-9]{2}|(PL)[0-9]{10}|(PT)[0-9]{9}|(RO)[0-9]{2,10}|(SE)[0-9]{12}|(SI)[0-9]{8}|(SK)[0-9]{10} |