Übersicht

Alle Konfigurationen für die READER befinden sich im C4 (/wiki/spaces/CD/pages/1639712) unterhalb der folgenden Pfade:

/clarc/Resources/xControl/Reader/

/clarc/Resources/xControl/Flows/

Strukturaufbau im C4

Im C4 sind die Optionen nach folgenden Kategorien untergliedert worden:

AddressReaderConfig - Globale und spezifische die Einstellungsmöglichkeiten für die Adressdatenerkennung
Configuration - Allgemeine Einstellungsmöglichkeiten für den Rechnungsleser
Database - Parameter für die verwendeten Tabellen und die Datenbankanbindung
Header - Allgemeine und sprachspezifische Parameter für die Kopfdatenerkennung
Position - Allgemeine und sprachspezifische Parameter für die Positionsdatenerkennung

Unterscheidung von Default und Custom

Abhängig von der Rangordnung wurden den Hauptkategorien (AddressReaderConfig, Configuration, Database, Header, Position) weitere Unterkategorien zugeordnet.

Jede Kategorie besitzt die Unterknoten: Default und Custom. Grundsätzlich befinden sich die Parameter im Default-Bereich. Der Custom-Bereich wird ausschließlich für kunden- und buchungskreisabhängige Konfigurationen verwendet. Jeder im Default definierte Parameter kann über Custom entsprechend angepasst werden.

Hinweis
Die Parameter dürfen ausschließlich im Custom-Bereich überschrieben werden. Ansonsten werden diese bei einem Update ggf. wieder überschrieben oder aktualisierte Erkennungsdaten nicht im System installiert.

Anpassungen

Für eine Anpassung wird der entsprechende Parameter aus dem Default-Bereich kopiert und in der jeweiligen Kategorie im Custom-Bereich modifiziert.

Hinweis

Die Namen der Parameter dürfen nicht verändert werden. Angepasst werden in dem Fall nur die Value Werte.

Buchungskreisabhängige Anpassung müssen die Bezeichnung eines Buchungskreises enthalten und diese sind nur gültig wenn der Buchungskreis vom System erfolgreich erfasst wird. Über das Dropdownmenü wird hier ein neuer Knoten angelegt mit dem jeweiligen Buchungskreis.

Bereiche

In der Konfigurationsstruktur des Readers befinden sich weitere Knoten die Elementar für die Erkennung sind:

Keywords: Schlüsselwörter sind Reguläre Ausdrücke, die bestimmte Zonen für mögliche Treffer auf einem Beleg abgreifen. Zum Beispiel ist die Rechnungsnummer ein Schlüsselwort und der eigentliche Wert in dem Fall die Rechnungsnummer

4711

12345 kann sich hierbei davor oder danach auf dem Beleg befinden.

Ignorwords: Ignorewords sind Elemente, die vor der Überprüfung der Schlüsselbegriffe (Key/Stopwords) aus dem Text entfernt werden da diese keine Relevanz haben.
Stopwords: Stoppwörter sind Wörter die ausschließen, dass ein Wert zu einem Schlüsselwort gehört. Beispiel: Lieferdatum 12.11.2020. Ein Stoppwort Lieferdatum für das Dokumentendatum würde dazu führen das ein Lieferdatum eben kein Dokumentendatum ist auch wenn bei Dokumentendatum ein Keyword hinterlegt wäre das Datum heißt.
Valuepattern: Beschreibt den Aufbau der gesuchten Information. Somit ist jedes Textelement das diesen Aufbau hat ein potentieller Kandidat für das gesuchte Kriterium. Beispiel Währung: (EUR|EURO|€) findet man eines dieser Werte dann ist die Wahrscheinlichkeit hoch, dass es sich um ein Kriterium für eine Währung handelt.

Sprachen im Reader

Länderspezifische Einstellungen

Die Sprachen bzw. Länder werden in Knoten abgebildet die mit dem Länderkürzel gekennzeichnet werden.

Eine Sprache kann dann verwendet werden, wenn diese über den Parameter Languages konfiguriert wurde.

Beispiel:

Codeblock
/clarc/Resources/xControl/Reader/Confirmation/Header/KeyWords/cz/Default

In diesem Knoten stehen alle Keywords auf Headerebene in der Sprache Tschechisch. Die Namen der Zugewiesenen Felder sind in allen Sprachen identisch.

Info

title	Information

Vorsicht je mehr Sprachen aktiv desto mehr Zeit benötigt die Erkennung. Des Weiteren ist darauf zu achten, dass in der OCR-Konfiguration die Sprache mit ausgewählt sein muss. Ist das nicht der Fall, werden vor allem Umlaute nicht erkannt.

Dokumentarten der READER

Der Reader verfügt über semantische Verfahren, die für eine vollautomatische Unterscheidung von verschiedenen Dokumententypen eingesetzt wird. Das vorliegende Dokument wird nach bestimmten Kriterien analysiert und dem richtigen Typ zugeordnet.

Grundsätzlich werden vier unterschiedliche Arten von Eingangsrechnungen unterschieden:

Eingangsrechnungen mit Bestellbezug (RM)
Eingangsrechnungen ohne Bestellbezug (RO)
Rechnungskorrekturen (Gutschriften) mit Bestellbezug (GM)
Rechnungskorrekturen (Gutschriften) ohne Bestellbezug (GO)
Auftragsbestätigungen
Auftragsänderungen
Bestellungen

Inhalt

Untergeordnete Seiten (Anzeige untergeordneter Seiten)

all	true
depth	1

Versionen im Vergleich

Alte Version 5

Neue Version 6

Schlüssel

Übersicht

Strukturaufbau im C4

Unterscheidung von Default und Custom

Anpassungen

Bereiche

Länderspezifische Einstellungen

Dokumentarten der READER

Seitenvergleich

Versionen im Vergleich

Alte Version 5

Neue Version 6

Schlüssel

Übersicht

Strukturaufbau im C4

Unterscheidung von Default und Custom

Anpassungen

Bereiche

Länderspezifische Einstellungen

Dokumentarten der READER