Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

„Make in Vietnam“-Kern-KI unter den Top 12 der Welt

Laut der Bewertung des Robust Reading Competition (RRC – ein renommierter wissenschaftlicher Spielplatz in der Welt) liegt das Bildtexterkennungsmodell CATI-VLM, ein „Make in Vietnam“-Produkt, unter den Top 12 der Welt.

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp03/07/2025



Im Kontext der digitalen Transformation und der Transformation hin zur künstlichen Intelligenz (KI) in Vietnam spielt die OCR-Technologie (optische Zeichenerkennung) eine immer wichtigere Rolle bei der Digitalisierung von Dokumenten, der Automatisierung von Geschäftsprozessen, der Kosteneinsparung und der Verbesserung der Managementeffizienz. Angesichts der Besonderheiten der vietnamesischen Sprache mit Akzenten und Handschrift beschränkt sich das Erkennungsproblem jedoch nicht auf das „Lesen von Wörtern“, sondern erfordert, dass das Modell den Kontext umfassend versteht.

Kürzlich gab das CMC Technology Application Institute (CMC ATI) bekannt, dass das von seinem Forschungsteam auf der Grundlage eines 5 TB großen Data Warehouse entwickelte CATI-VLM-Modell (Visual Document Understanding) in der Kategorie Document Visual Question Answering (DocVQA) im Juni 2025 in der Rangliste der Robust Reading Competition (RRC) weltweit unter die Top 12 und in Vietnam unter die Top 12 gelangte.

Bildunterschrift

RRC-Ranking in DocVQA-Kategorie 6/2025.

Der Robust Reading Competition (RRC) ist ein renommierter wissenschaftlicher Spielplatz (https://rrc.cvc.uab.es/), der vom Computer Vision Center (CVC) der Autonomen Universität Barcelona (UAB) in Spanien organisiert wird, einer weltweit renommierten Forschungseinrichtung auf dem Gebiet des Computersehens. Der 2011 ins Leben gerufene Wettbewerb, der stets begleitend zur International Conference on Text Analysis and Recognition ICDAR stattfindet – einem der weltweit größten Foren für Dokumentenanalyse und Computersehen – hat sich zu einem wichtigen Ereignis entwickelt, das Forscher, Ingenieure von renommierten Universitäten, Forschungsinstituten und Technologieunternehmen wie der Tsinghua-Universität, der Hyundai Motor Group und Tencent... anzieht. Die Aufgaben des RRC zielen darauf ab, den technologischen Fortschritt zu fördern und sind eng mit praktischen Problemen verknüpft, von Übersetzung und Unternehmensdatenmanagement bis hin zu Stadtanalyse und historischer Dokumentenverarbeitung.

Dr. Dang Minh Tuan, Direktor von CMC ATI, erklärte: „Die Forschungskapazität des CMC-Teams wird durch eine so renommierte globale Plattform wie RRC bestätigt. Wir sind stolz darauf, dass das Team in so kurzer Zeit ein hohes Ranking erreichen konnte und Seite an Seite mit großen Namen aus Industrieländern steht. Noch wichtiger ist, dass dies ein klarer Beweis für die Fähigkeit ist, Technologien zu beherrschen, um spezifische Probleme der Vietnamesen und spezialisierter Bereiche in Vietnam zu lösen.“


CATI-VLM unterscheidet sich von herkömmlicher OCR dadurch, dass es nicht nur Zeichen extrahiert, sondern auch mehrere Informationsebenen versteht: Textinhalte, Nicht-Text-Elemente (Kontrollkästchen, Diagramme, Signaturen, Formeln), Layout (Seitenstruktur, Tabellen, Formulare) und Stil (Schriftarten, Hervorhebungen usw.). Das Modell kann visuelle Fragen zu Dokumentbildern beantworten, ähnlich wie ChatGPT, ohne dass bestimmte Formulare im Voraus erlernt werden müssen.



Laut News and People Zeitung

Quelle: https://doanhnghiepvn.vn/cong-nghe/ai-loi-make-in-vietnam-duoc-xep-hang-top-12-the-gioi/20250703100726051


Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Im Ausstellungsraum zum 80. Jahrestag des Nationalfeiertags am 2. September
Überblick über die erste A80-Trainingseinheit am Ba Dinh Square
Lang Son erweitert internationale Zusammenarbeit zur Erhaltung des kulturellen Erbes
Patriotismus auf junge Art

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt