READER - Konfiguration

Übersicht

Alle Konfigurationen für die READER befinden sich im C4 (/wiki/spaces/CD/pages/1639712) unterhalb der folgenden Pfade:

/clarc/Resources/xControl/Reader/
/clarc/Resources/xControl/Flows/

Strukturaufbau im C4

Im C4 sind die Optionen nach folgenden Kategorien untergliedert worden:

  • AddressReaderConfig - Globale und spezifische die Einstellungsmöglichkeiten für die Adressdatenerkennung
  • Configuration - Allgemeine Einstellungsmöglichkeiten für den Rechnungsleser
  • Database - Parameter für die verwendeten Tabellen und die Datenbankanbindung
  • Header - Allgemeine und sprachspezifische Parameter für die Kopfdatenerkennung
  • Position - Allgemeine und sprachspezifische Parameter für die Positionsdatenerkennung

Unterscheidung von Default und Custom

Abhängig von der Rangordnung wurden den Hauptkategorien (AddressReaderConfig, Configuration, Database, Header, Position) weitere Unterkategorien zugeordnet.

Jede Kategorie besitzt die Unterknoten: Default und Custom. Grundsätzlich befinden sich die Parameter im Default-Bereich. Der Custom-Bereich wird ausschließlich für kunden- und buchungskreisabhängige Konfigurationen verwendet.  Jeder im Default definierte Parameter kann über Custom entsprechend angepasst werden.

Die Parameter dürfen ausschließlich im Custom-Bereich überschrieben werden. Ansonsten werden diese bei einem Update ggf. wieder überschrieben oder aktualisierte Erkennungsdaten nicht im System installiert.

Anpassungen

Für eine Anpassung wird der entsprechende Parameter aus dem Default-Bereich kopiert und in der jeweiligen Kategorie im Custom-Bereich modifiziert. 

Die Namen der Parameter dürfen nicht verändert werden. Angepasst werden in dem Fall nur die Value Werte. 

Buchungskreisabhängige Anpassung müssen die Bezeichnung eines Buchungskreises enthalten und diese sind nur gültig wenn der Buchungskreis vom System erfolgreich erfasst wird. Über das Dropdownmenü wird hier ein neuer Knoten angelegt mit dem jeweiligen Buchungskreis.

Bereiche

In der Konfigurationsstruktur des Readers befinden sich weitere Knoten die Elementar für die Erkennung sind:

  • Keywords: Schlüsselwörter sind Reguläre Ausdrücke, die bestimmte Zonen für mögliche Treffer auf einem Beleg abgreifen. Zum Beispiel ist die Rechnungsnummer ein Schlüsselwort und der eigentliche Wert in dem Fall die Rechnungsnummer 12345 kann sich hierbei davor oder danach auf dem Beleg befinden.
  • Ignorwords: Ignorewords sind Elemente, die vor der Überprüfung der Schlüsselbegriffe (Key/Stopwords) aus dem Text entfernt werden da diese keine Relevanz haben.
  • Stopwords: Stoppwörter sind Wörter die ausschließen, dass ein Wert zu einem Schlüsselwort gehört. Beispiel: Lieferdatum 12.11.2020. Ein Stoppwort Lieferdatum für das Dokumentendatum würde dazu führen das ein Lieferdatum eben kein Dokumentendatum ist auch wenn bei Dokumentendatum ein Keyword hinterlegt wäre das Datum heißt.
  • Valuepattern: Beschreibt den Aufbau der gesuchten Information. Somit ist jedes Textelement das diesen Aufbau hat ein potentieller Kandidat für das gesuchte Kriterium. Beispiel Währung: (EUR|EURO|€) findet man eines dieser Werte dann ist die Wahrscheinlichkeit hoch, dass es sich um ein Kriterium für eine Währung handelt.

Länderspezifische Einstellungen

Die Sprachen bzw. Länder werden in Knoten abgebildet die mit dem Länderkürzel gekennzeichnet werden.

Eine Sprache kann dann verwendet werden, wenn diese über den Parameter Languages konfiguriert wurde. 

Beispiel:

/clarc/Resources/xControl/Reader/Confirmation/Header/KeyWords/cz/Default

In diesem Knoten stehen alle Keywords auf Headerebene in der Sprache Tschechisch. Die Namen der Zugewiesenen Felder sind in allen Sprachen identisch.

Information

Vorsicht je mehr Sprachen aktiv desto mehr Zeit benötigt die Erkennung. Des Weiteren ist darauf zu achten, dass in der OCR-Konfiguration die Sprache mit ausgewählt sein muss. Ist das nicht der Fall, werden vor allem Umlaute nicht erkannt. 

Dokumentarten der READER

Der Reader verfügt über semantische Verfahren, die für eine vollautomatische Unterscheidung von verschiedenen Dokumententypen eingesetzt wird. Das vorliegende Dokument wird nach bestimmten Kriterien analysiert und dem richtigen Typ zugeordnet.

Grundsätzlich werden vier unterschiedliche Arten von Eingangsrechnungen unterschieden:

  • Eingangsrechnungen mit Bestellbezug (RM)
  • Eingangsrechnungen ohne Bestellbezug (RO)
  • Rechnungskorrekturen (Gutschriften) mit Bestellbezug (GM)
  • Rechnungskorrekturen (Gutschriften) ohne Bestellbezug (GO)
  • Auftragsbestätigungen 
  • Auftragsänderungen
  • Bestellungen