Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC belegt weltweit den 12. Platz bei der Texterkennung

Das vom CMC Technology Application Institute (CMC ATI) entwickelte CATI-VLM-Modell (Visual Document Understanding) hat viele internationale Konkurrenten übertroffen und in der kürzlich von der Robust Reading Competition (RRC) im Juni 2025 in der Kategorie Document Visual Question Answering (DocVQA) veröffentlichten Rangliste die Top 12 der Welt und die Top 1 in Vietnam erreicht.

Báo Nhân dânBáo Nhân dân02/07/2025

RRC-Ranking in DocVQA-Kategorie 6/2025.

RRC-Ranking in DocVQA-Kategorie 6/2025.

Im Kontext der in Vietnam stattfindenden digitalen Transformation und der Transformation von Anwendungen künstlicher Intelligenz spielt die OCR-Technologie (Optical Character Recognition) eine immer wichtigere Rolle bei der Digitalisierung von Dokumenten, der Automatisierung von Geschäftsprozessen, der Kosteneinsparung und der Verbesserung der Managementeffizienz. Angesichts der Besonderheiten der vietnamesischen Sprache mit Akzent und Handschrift beschränkt sich das Erkennungsproblem jedoch nicht auf das „Lesen von Wörtern“, sondern erfordert ein umfassendes Kontextverständnis des Modells.

Kürzlich hat das CMC Technology Application Institute (CMC ATI) das CATI-VLM-Modell (Visual Document Understanding) angekündigt – das vom Forschungsteam auf der Grundlage eines 5 TB großen Data Warehouse entwickelt wurde. Damit ließ es viele internationale Konkurrenten hinter sich und erreichte in der soeben von der Robust Reading Competition (RRC) im Juni 2025 bekannt gegebenen Rangliste in der Kategorie Document Visual Question Answering (DocVQA) die Top 12 der Welt und die Top 1 in Vietnam.

Der Robust Reading Competition (RRC) ist ein renommierter wissenschaftlicher Spielplatz (https://rrc.cvc.uab.es/), der vom Computer Vision Center (CVC) der Universitat Autònoma de Barcelona (UAB) in Spanien organisiert wird, einer weltweit renommierten Forschungseinrichtung auf dem Gebiet der Computervision.

Der Wettbewerb wurde 2011 ins Leben gerufen und findet jährlich im Rahmen der International Conference on Text Analysis and Recognition (ICDAR) statt – einem der weltweit führenden Foren im Bereich Computer Vision. Der Wettbewerb zieht zahlreiche Forscher und Ingenieure von Universitäten, Forschungsinstituten und großen Technologiekonzernen wie der Tsinghua-Universität, der Hyundai Motor Group, Tencent usw. an. Die Probleme der RRC sollen den technologischen Fortschritt fördern und sind eng mit praktischen Problemen verknüpft, von der Übersetzung über das Unternehmensdatenmanagement bis hin zur Stadtanalyse und der Verarbeitung historischer Dokumente.

Dr. Dang Minh Tuan, Direktor von CMC ATI, erklärte: „Wir freuen uns sehr, dass die Forschungskapazität des CMC-Teams durch eine so renommierte globale Plattform wie RRC bestätigt wurde. In nur kurzer Zeit hat das Forschungsteam hohe Platzierungen erreicht und damit seine internationale Wettbewerbsfähigkeit gegenüber namhaften Unternehmen aus Industrieländern unter Beweis gestellt. Noch wichtiger ist, dass dies ein klarer Beweis für die Fähigkeit ist, Technologien zu beherrschen, um spezifische Probleme der vietnamesischen Sprache und spezialisierter Felder in Vietnam zu lösen.“

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Dr. Dang Minh Tuan, Direktor von CMC ATI.

CATI-VLM unterscheidet sich von herkömmlicher OCR dadurch, dass es nicht nur Zeichen extrahiert, sondern auch mehrere Informationsebenen versteht: Textinhalte, Nicht-Text-Elemente (Kontrollkästchen, Diagramme, Signaturen, Formeln), Layout (Seitenstruktur, Tabellen, Formulare) und Stil (Schriftarten, Hervorhebungen usw.). Das Modell kann visuelle Fragen zu Dokumentbildern beantworten, ähnlich wie ChatGPT, ohne dass zuvor bestimmte Formulare erlernt werden müssen.

Bemerkenswert ist, dass CATI-VLM in der RRC-Rangliste mit nur 3 Milliarden Parametern die höchste Genauigkeit in 4/7 Datensätzen erreichte und viele Big-Tech-Modelle wie Deepseek (27 Milliarden Parameter), GPT-4 Vision Turbo + Amazon Textract OCR (Top 34) oder Baidu (Top 22) übertraf.

Dieser Erfolg zeigt auch einen praktischen Ansatz, der sich auf die Beherrschung der Kerntechnologie konzentriert und das Modell an die Infrastrukturbedingungen Vietnams anpasst, anstatt der Parameterskala hinterherzujagen.

Bild-2.jpg

Muster-Bewerbungsformular für die Hochschulzulassung

Bild-3.jpg

Der Text wurde anhand der Handschrift im obigen Bild erkannt.

Herr Nguyen Trung Chinh, Vorstandsvorsitzender und Executive Chairman der CMC Technology Group, betonte: „Dies ist das Ergebnis von mehr als einem Jahrzehnt kontinuierlicher Investitionen in Technologieforschung und -entwicklung (F&E). Die großen Erfolge von CMC auf dem internationalen Technologiemarkt bestätigen die Strategie, die vietnamesische Technologie zu beherrschen, gepaart mit der Ausrichtung auf die KI-Transformation und den Eintritt in den globalen Markt. Wir sind überzeugt, dass der vietnamesische Geheimdienst durchaus in der Lage ist, Schulter an Schulter mit den globalen Big Tech-Unternehmen zu bestehen und sich eine würdige Position auf der weltweiten Technologielandkarte zu sichern.“

CATI-VLM wird in der Produktkette des C.OpenAI-Ökosystems eingesetzt, darunter: virtueller CLS-Assistent zur Überprüfung juristischer Dokumente, CMC SmartDoc – Plattform zur digitalen Dokumentenkonvertierung, CMC KMS-Wissensmanagementsystem, automatisches Berichtssystem für intelligente Büros und Agentic Documents-Anwendungen der neuen Generation.

QUANG HUY

Quelle: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Etikett: CMCCMC Corp

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Überflutete Gebiete in Lang Son, vom Hubschrauber aus gesehen
Bild von dunklen Wolken, die kurz vor dem Einsturz stehen, in Hanoi
Der Regen strömte herab, die Straßen verwandelten sich in Flüsse, die Leute von Hanoi brachten Boote auf die Straßen
Nachstellung des Mittherbstfestes der Ly-Dynastie in der kaiserlichen Zitadelle Thang Long

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Aktuelle Veranstaltungen

Politisches System

Lokal

Produkt