Deutsche Nachrichtenveranstaltungen finden statt

GESTALTUNG DER ZUKUNFT DER DOKUMENTENVERARBEITUNG: ROSSUM PRÄSENTIERT DIE GEWINNER DES DOCILE-WETTBEWERBS

  • Das Team, das eine auf GraphDoc basierende Lösung von der Universität für Wissenschaft und Technologie China und dem iFLYTEK Forschungsinstitut verwendet, gewinnt Rossums DocILE-Wettbewerb und zeigt bahnbrechende Techniken in der Dokumentinformationsgewinnung.
  • Der Wettbewerb unterstreicht die Synergie zwischen Computer Vision und Transformer-Architekturen und betont die Notwendigkeit einer umfassenden Strategie bei der Verarbeitung komplexer Geschäftsdokumente.
  • Die DocILE-Initiative von Rossum regt die Zusammenarbeit, Innovation und einen globalen Maßstab für intelligente Dokumentenverarbeitung an und bekräftigt das Engagement des Unternehmens für die Förderung der Forschung auf diesem Gebiet.

LONDON, 25. September 2023 – Rossum, ein führender Anbieter im Bereich Intelligent Document Processing, ist begeistert, die bemerkenswerten Ergebnisse seines bahnbrechenden DocILE-Wettbewerbs (Document Information Localization and Extraction) zu enthüllen. Diese globale Veranstaltung, die im Februar 2022 begann, hat einen unauslöschlichen Eindruck im Bereich der Dokumentenverarbeitung hinterlassen.


Rossum ist ein Pionier in der Cloud-nativen Intelligent Document Processing (IDP), die den Dokumentenworkflow für Unternehmen vollständig umgestaltet. (PRNewsfoto/Rossum)

Rossum startete 2022 die DocILE-Initiative und gewährte Zugang zu einem Schatztrove von über 6.700 sorgfältig annotierten Geschäftsdokumenten sowie 100.000 synthetisch generierten Dokumenten.

Dieser beispiellose Benchmark-Datensatz diente den Teilnehmern weltweit als Prüfstein, an dem sie ihre Lösungen an etablierten Methoden messen konnten. Im Laufe eines Jahres nutzten diverse Teams diesen Datensatz, um ihre Fähigkeiten zu schärfen, kritische Daten wie USt-Nummern und Firmenadressen in semi-strukturierten Geschäftsdokumenten zu lokalisieren.

Der Wettbewerb endete am 24. Mai 2023 und zog eine breite Palette von Einreichungen an. Die Teilnehmer präsentierten ihre Innovationen, indem sie unterschiedliche Ansätze zur Bewältigung der komplexen Herausforderungen bei der Extraktion von Dokumentinformationen entwickelten.

Ein Team der Universität für Wissenschaft und Technologie China und des iFLYTEK Forschungsinstituts stellte eine Methode namens „GraphDoc“ vor und belegte den ersten Platz, indem es in den Aufgaben zur Lokalisierung und Extraktion wichtiger Informationen (KILE) und zur Zeilenerkennung (LIR) Spitzenleistungen erzielte und damit die anderen Teilnehmer deutlich übertraf.

Ihr Erfolg wurde durch eine innovative Verwendung der Transformer-Architektur ermöglicht, die ihnen von Anfang an einen Vorsprung im Wettbewerb verschaffte. Sie führten eine bemerkenswerte Technik ein, die das Erlernen umfasste, welche Wörter kombiniert werden müssen, um den korrekten extrahierten Wert zu erhalten, und nutzten auf Datentrends basierende Heuristiken, um ihre Ergebnisse weiter zu verbessern.

Der Wettbewerb zeigte eine Mischung unterschiedlicher Methoden, wobei einige sich auf Computer Vision und andere auf Transformer-Architekturen stützten, was die wachsende Popularität der Letzteren auf diesem Gebiet demonstrierte. Noch wichtiger ist, dass der Wettbewerb zeigte, dass es notwendig ist, das Dokument gleichzeitig als Bild und als den Text, den es enthält, zu verstehen, da rein computergestützte Methoden und traditionelle Transformer, die nur mit dem Text arbeiten, nicht die gleiche Leistung erbringen können.

Durch die Kombination dieser beiden Ansätze waren die Teilnehmer in der Lage, ein tieferes und genaueres Verständnis komplexer Geschäftsdokumente zu erreichen, wobei Computer Vision spezifische Herausforderungen adressierte, während Transformer sich um andere Aspekte kümmerten. Dies unterstrich die Notwendigkeit einer umfassenden Strategie, die sowohl den Text als auch die visuelle Struktur von Dokumenten für eine präzise Interpretation berücksichtigt.

Štěpán Šimsa, Forschungswissenschaftler bei Rossum, äußerte sich begeistert über die Auswirkungen des Wettbewerbs: „Die DocILE-Initiative hat nicht nur bahnbrechende Forschung angestoßen, sondern auch die Zusammenarbeit und Innovation in der Branche gefördert. Indem wir methodische Lücken überbrücken, befähigen wir die Community für intelligente Dokumentenverarbeitung, Lösungen zu entwickeln, die Geschäftsabläufe revolutionieren.“

Im Rahmen des Wettbewerbs mussten die Teilnehmer ihren Code als Open Source veröffentlichen und eine Arbeit verfassen, in der sie ihre angewandte Methode beschreiben. Der Preispool umfasste 8.000 US-Dollar, von denen 6.000 US-Dollar an die siegreiche GraphDoc-Lösung gingen, da sie nicht nur den ersten Platz, sondern auch den „Best Paper Award“ erhielt.

Dieser Wettbewerb verkörpert Rossums unerschütterliche Mission, die Entwicklung des Bereichs Intelligent Document Processing im globalen Maßstab voranzutreiben und einen Benchmark für das Dokumentenverständnis zu setzen. Diese Initiative dient als Katalysator, der die Entwicklung neuartiger Techniken anregt, die die Präzision und Effizienz der Extraktion von Dokumentinformationen verbessern – ein Zeugnis für Rossums Kernwerte Innovation und Exzellenz.

Über Rossum

Rossum ist eine führende Lösung für intelligente Dokumentenverarbeitung (IDP), die die branchenweit fortschrittlichsten Datengewinnungsfunktionen mit einer kompletten Low-Code-Plattform kombiniert, die einen großen Teil der manuellen Arbeit im Dokumentenverarbeitungsworkflow von Unternehmen automatisiert. Hunderte von Organisationen aller Größen und Branchen, darunter Bosch, Morton Salt und The Master Trust Bank of Japan, nutzen Rossum, um den manuellen Aufwand zu reduzieren, die Durchlaufzeiten zu verkürzen und Fehler zu vermeiden. Erfahren Sie mehr unter www.rossum.ai.

Über die DocILE-Initiative

Die DocILE-Initiative (Document Information Localization and Extraction) ist Vorreiter bei der Weiterentwicklung der intelligenten Dokumentenverarbeitung (IDP). Durch die Schaffung eines umfangreichen Forschungs-Benchmarks für maschinelle Lernverfahren im Dokumentenverständnis fördert die Initiative Zusammenarbeit, Innovation und die Entwicklung modernster Techniken.

DocILE wurde im August in Kalifornien auf der größten Konferenz für Dokumentenverständnis, der „International Conference on Document Analysis and Recognition“ (ICDAR), gestartet, wo sie großes Interesse in der Forschungsgemeinschaft weckte und eine schnellere Entwicklung von KI-Techniken versprach, die die IDP revolutionieren können.

Medienkontakt:

Rami Deeb

rami.deeb@rossum.ai

+352 621 510 930

SOURCE Rossum