Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

CMC mencapai 12 teratas dunia dalam pengiktirafan teks

Model CATI-VLM (Pemahaman Dokumen Visual) yang dibangunkan oleh Institut Aplikasi Teknologi CMC (CMC ATI) telah mengatasi banyak pesaing antarabangsa untuk mencapai 12 teratas di dunia dan 1 teratas di Vietnam dalam kedudukan yang diumumkan baru-baru ini oleh Pertandingan Membaca Teguh (RRC) pada Jun 2025 dalam kategori Menjawab Soalan Visual Dokumen (DocVQA).

Báo Nhân dânBáo Nhân dân02/07/2025

Kedudukan RRC dalam kategori DocVQA 6/2025.

Kedudukan RRC dalam kategori DocVQA 6/2025.

Dalam konteks transformasi digital dan transformasi aplikasi kecerdasan buatan di Vietnam, teknologi OCR (Optical Character Recognition) memainkan peranan yang semakin penting dalam mendigitalkan dokumen, mengautomasikan proses perniagaan, menjimatkan kos dan meningkatkan kecekapan pengurusan. Namun, dengan ciri-ciri bahasa Vietnam dengan loghat dan tulisan tangan, masalah pengecaman tidak terhenti pada 'membaca perkataan', tetapi memerlukan model itu mempunyai kebolehan memahami konteks secara menyeluruh.

Baru-baru ini, CMC Technology Application Institute (CMC ATI) mengumumkan model CATI-VLM (Visual Document Understanding) - dibangunkan oleh pasukan penyelidik daripada gudang data besar 5TB, mengatasi banyak pesaing antarabangsa untuk mencapai 12 teratas dunia dan 1 teratas di Vietnam dalam kedudukan yang baru diumumkan oleh Pertandingan Membaca Teguh (RRC) pada DocAc2025 (RRC) pada 20 Jun. kategori.

Pertandingan Membaca Teguh (RRC) ialah taman permainan saintifik yang berprestij, (https://rrc.cvc.uab.es/) yang dianjurkan oleh Pusat Penglihatan Komputer (CVC) Universitat Autònoma de Barcelona (UAB) Sepanyol, kemudahan penyelidikan berprestij di dunia dalam bidang penglihatan komputer.

Pertandingan ini telah dimulakan pada tahun 2011 dan diadakan setiap tahun dalam rangka Persidangan Antarabangsa Mengenai Analisis dan Pengiktirafan Teks (ICDAR) - salah satu forum terkemuka dunia dalam bidang penglihatan komputer. Pertandingan ini menarik sejumlah besar penyelidik dan jurutera dari universiti, institut penyelidikan dan syarikat teknologi besar seperti Universiti Tsinghua, Hyundai Motor Group, Tencent... Masalah RRC direka untuk mempromosikan kemajuan teknologi, berkait rapat dengan masalah praktikal daripada terjemahan, pengurusan data perusahaan hingga analisis bandar dan pemprosesan dokumen sejarah.

Dr. Dang Minh Tuan, Pengarah CMC ATI berkongsi: "Kami sangat gembira kerana kapasiti penyelidikan pasukan CMC telah disahkan melalui taman permainan global yang berprestij seperti RRC. Dalam masa yang singkat, pasukan penyelidik telah mencapai kedudukan tinggi, menunjukkan daya saing antarabangsanya dengan nama-nama besar dari negara maju. Lebih penting lagi, ini adalah demonstrasi yang jelas tentang teknologi yang jelas dan keupayaan khusus dalam bidang Vietnam untuk menguasai Vietnam."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Dr Dang Minh Tuan, Pengarah CMC ATI.

CATI-VLM berbeza daripada OCR tradisional kerana ia bukan sahaja mengekstrak aksara, tetapi juga memahami pelbagai lapisan maklumat: kandungan teks, elemen bukan teks (kotak tanda, kotak semak, carta, tandatangan, formula), susun atur (struktur halaman, jadual, borang) dan gaya (fon, sorotan, dll.). Model ini boleh menjawab soalan visual yang dikemukakan pada imej dokumen, serupa dengan ChatGPT, tanpa perlu mempelajari borang tertentu terlebih dahulu.

Terutama, pada kedudukan RRC, CATI-VLM dengan hanya 3 bilion parameter mencapai ketepatan tertinggi dalam set data 4/7, mengatasi banyak model Big Tech seperti Deepseek (27 bilion parameter), GPT-4 Vision Turbo + Amazon Texttract OCR (top 34) atau Baidu (top 22).

Pencapaian itu juga menunjukkan pendekatan praktikal, memfokuskan kepada penguasaan teknologi teras, mengoptimumkan model agar sesuai dengan keadaan infrastruktur Vietnam dan bukannya mengejar skala parameter.

imej-2.jpg

Contoh Borang Permohonan Kemasukan Kolej

imej-3.jpg

Teks telah dikenali daripada tulisan tangan dalam imej di atas.

Encik Nguyen Trung Chinh, Pengerusi Lembaga Pengarah, Pengerusi Eksekutif Kumpulan Teknologi CMC, menekankan: "Ini adalah hasil daripada lebih sedekad pelaburan berterusan dalam penyelidikan dan pembangunan teknologi (R&D). Pencapaian tinggi CMC di taman permainan teknologi antarabangsa mengesahkan strategi menguasai teknologi Vietnam, ditambah pula dengan orientasi Transformasi AI yang kukuh. berganding bahu dengan Big Tech global, mewujudkan kedudukan yang layak pada peta teknologi dunia."

CATI-VLM akan digunakan dalam rantaian produk ekosistem C.OpenAI, termasuk: pembantu maya CLS untuk menyemak dokumen undang-undang, CMC SmartDoc - platform penukaran dokumen digital, sistem pengurusan pengetahuan CMC KMS, sistem pelaporan automatik untuk pejabat pintar dan aplikasi Dokumen Agentik generasi baharu.

QUANG HUY

Sumber: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Komen (0)

No data
No data

Dalam topik yang sama

Dalam kategori yang sama

48 jam memburu awan, menonton sawah, makan ayam di Y Ty
Rahsia prestasi terbaik Su-30MK2 di langit Ba Dinh pada 2 September
Tuyen Quang menyala dengan tanglung Pertengahan Musim Luruh gergasi semasa malam perayaan
Suku Lama Hanoi memakai 'pakaian' baharu, menyambut Festival Pertengahan Musim Luruh dengan cemerlang

Daripada pengarang yang sama

Warisan

Rajah

Perniagaan

No videos available

Berita

Sistem Politik

Tempatan

produk