Vietnam.vn - Nền tảng quảng bá Việt Nam

CMCs KI-Kern „Make in Vietnam“ unter den Top 12 der Welt

Das vom Forschungsteam des CMC entwickelte CATI-VLM-Modell hat es in der kürzlich von der Robust Reading Competition im Juni 2025 veröffentlichten Rangliste unter die Top 12 weltweit und unter die Top 1 in Vietnam geschafft.

VietNamNetVietNamNet03/07/2025


AI-Modell.jpg

Der KI-Transformationsprozess in Vietnam schreitet voran. OCR-Technologie (Optical Character Recognition) spielt eine zunehmend wichtige Rolle bei der Dokumentendigitalisierung. Foto: Illustration

Kürzlich gab das CMC Technology Application Institute (CMC ATI) bekannt, dass das von seinem Forschungsteam auf der Grundlage eines 5 TB großen Data Warehouse entwickelte CATI-VLM-Modell (Visual Document Understanding) in der Kategorie Document Visual Question Answering (DocVQA) im Juni 2025 in der soeben von der Robust Reading Competition (RRC) bekannt gegebenen Rangliste weltweit unter die Top 12 und in Vietnam unter die Top 12 gelangte.

Herr Dang Minh Tuan, Direktor von CMC ATI, erklärte: „Wir freuen uns sehr, dass die Forschungskapazität des CMC-Teams durch eine renommierte globale Plattform wie RRC bestätigt wurde. Wir sind stolz darauf, dass das Team in so kurzer Zeit ein hohes Ranking erreichen konnte und Seite an Seite mit namhaften Unternehmen aus Industrieländern steht. Noch wichtiger ist, dass dies ein klarer Beweis für die Fähigkeit ist, Technologien zu beherrschen, um spezifische Probleme der Vietnamesen und spezialisierter Bereiche in Vietnam zu lösen.“

Im Kontext der in Vietnam stark voranschreitenden digitalen Transformation und KI-Transformation spielt die OCR-Technologie (Optical Character Recognition) eine immer wichtigere Rolle bei der Digitalisierung von Dokumenten, der Automatisierung von Geschäftsprozessen, der Kosteneinsparung und der Verbesserung der Managementeffizienz.

Angesichts der Besonderheiten des Vietnamesischen mit Akzent und Handschrift beschränkt sich das Erkennungsproblem jedoch nicht auf das „Lesen von Wörtern“, sondern erfordert, dass das Modell in der Lage ist, den Kontext umfassend zu verstehen.

CATI-VLM unterscheidet sich von herkömmlicher OCR dadurch, dass es nicht nur Zeichen extrahiert, sondern auch mehrere Informationsebenen versteht: Textinhalt, Nicht-Text-Elemente (Kontrollkästchen, Checkboxen, Diagramme, Unterschriften, Formeln), Layout (Seitenstruktur, Tabellen, Formulare) und Stil (Schriftarten, Hervorhebungen usw.).

Das Modell kann visuelle Fragen zu Dokumentbildern beantworten, ähnlich wie ChatGPT, ohne dass vorher bestimmte Formulare erlernt werden müssen.

CMC AI.jpg

Der Robust Reading Competition (RRC) ist ein renommierter wissenschaftlicher Spielplatz, der vom Computer Vision Center der Autonomen Universität Barcelona (UAB) in Spanien organisiert wird, einer weltweit renommierten Forschungseinrichtung auf dem Gebiet der Computervision.

Der Wettbewerb wurde 2011 ins Leben gerufen und findet stets im Rahmen der International Conference on Text Analysis and Recognition ICDAR statt – einem der weltweit größten Foren für Dokumentenanalyse und Computervision. Er hat sich zu einem wichtigen Ereignis entwickelt, das Forscher, Ingenieure von renommierten Universitäten, Forschungsinstituten und Technologieunternehmen wie der Tsinghua University, der Hyundai Motor Group und Tencent anzieht.

Die Missionen des RRC zielen darauf ab, den technologischen Fortschritt voranzutreiben und basieren auf praktischen Problemen, die von der Übersetzung und Unternehmensdatenverwaltung bis hin zur Stadtanalyse und historischen Dokumentenverarbeitung reichen.

Von der Arbeit bis zur Kindererziehung: So nutzen CEOs von Technologieunternehmen KI täglich. Von Jensen Huang bis Tim Cook nutzen die mächtigsten CEOs der Welt KI in ihrem Alltag.

Quelle: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html


Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Wunderschöner Sonnenaufgang über dem Meer von Vietnam
Der majestätische Höhlenbogen in Tu Lan
Lotustee – Ein duftendes Geschenk der Hanoi
Mehr als 18.000 Pagoden im ganzen Land läuteten heute Morgen Glocken und Trommeln, um für nationalen Frieden und Wohlstand zu beten.

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt