WEB VALIDATION Training
- Merve Yurdakul
- Dennis Balzuweit
Übersicht
Das in der WEB VALIDATION integrierte Training ist eine einfache und effiziente Möglichkeit zur Erfassung von Trainingsdaten und zur Verbesserung der Erkennungsergebnisse in dem darunterliegenden Extraktionsprojekt (zum Beispiel CLARC READER).
Das Training kann von einem Benutzer während der Validierung durchgeführt und getestet werden und umfasst sowohl Kopf- als auch Positionsdaten.
Training
Nachdem der Trainingsmodus gestartet wurde, kann der Anwender das zu trainierende Feld im Bereich der Kopffelder oder in der Positionstabellenkopfzeile auswählen. Die trainierbaren Felder sind für jedes Extraktionsprojekt konfigurierbar und werden dem Anwender farblich blau hervorgehoben angezeigt.
Bereits trainierte Felder zeichnen sich durch eine grüne Markierung aus.
Der Trainingsdetailbereich wird eingeblendet sobald ein Feld ausgewählt wurde und mit bereits vorhandenen Trainingsdaten gefüllt.
Die einfachste Möglichkeit ein Feld zu trainieren ist über eine Kombination aus Maus und Strg-Taste eine feste Zone um einen Bereich auf dem Beleg zu ziehen. In diesem Bereich wird in der Extraktion dann später nach einem passenden Wert für das Feld gesucht. Zusätzlich wird dabei ein Beispielwert ermittelt um die Erkennung zu verbessern - der Wert kann manuell geändert werden.
Um das Training dynamischer zu gestalten, kann zusätzlich ein Schlüsselwort hinzugefügt und eine räumliche Abhängigkeit zur Zone definiert werden.
Wird dann das Schlüsselwort auf dem Dokument gefunden, erfolgt die Ermittlung des Feldwerts relativ zur erkannten Schlüsselwortposition. Dies ist zum Beispiel für einen Rechnungsendbetrag interessant.
Eine weitere Möglichkeit ist die Definition eines regulären Ausdrucks mit dessen Hilfe der gewünschte Inhalt ermittelt werden soll. Diese Möglichkeit erfordert jedoch Expertenwissen um reguläre Ausdrücke korrekt formulieren zu können. Siehe auch Reguläre Ausdrücke.
Die Eigenschaft Obligatorisch wird teilweise vorgegeben oder kann manuell gesetzt werden.
Für die Erkennung von Positionsdaten müssen jeweils mindestens 2 Pflichtfelder definiert sein.
- Trainingsfeld, das bisher noch nicht trainiert wurde.
- Trainingsfeld, das bereits trainiert wurde.
- Durch Anklicken des Feldes werden die Trainingsdetails des Feldes angezeigt.
- Trainingsfeld in der Positionstabelle
- Trainingsdetailbereich
- Hier werden die Trainingsdetails des zuletzt ausgewählten Trainingsfeldes angezeigt.
- Trainingshinweis
- Feldname des gewählten Feldes
- Benutzer, der das Training zuletzt bearbeitet hat
- Trainingsbeispiel, das mit dem Feldwert aus dem Dokument gefüllt wird
- Regulärer Ausdruck. Der Ausdruck wird gegen den
- Wert im trainierten Bereich getestet.
- Das Schlüsselwort für dynamische Feldtrainings.
- Löscht das Training für das ausgewählte Feld.
- Startet das Auswählen des Schlüsselwortbereiches.
Bearbeitungswerkzeuge
Training | ||
---|---|---|
Training starten | Startet das Training und blendet die Trainingsinformationen ein. | |
Training beenden | Beendet das Training und speichert die Änderungen an den Trainingsdaten. | |
Training speichern | Speichert die Trainingsdaten in die Datenbank | |
Training löschen | Löscht alle Trainingsdaten zum Kreditor | |
Training testen | Führt die Erkennung des Dokuments erneut aus und füllt die Felder mit den neu erkannten Inhalten. |