Kedudukan RRC dalam kategori DocVQA 6/2025.
Dalam konteks transformasi digital dan transformasi aplikasi kecerdasan buatan di Vietnam, teknologi OCR (Optical Character Recognition) memainkan peranan yang semakin penting dalam mendigitalkan dokumen, mengautomasikan proses perniagaan, menjimatkan kos dan meningkatkan kecekapan pengurusan. Namun, dengan ciri-ciri bahasa Vietnam dengan loghat dan tulisan tangan, masalah pengecaman tidak terhenti pada 'membaca perkataan', tetapi memerlukan model itu mempunyai kebolehan memahami konteks secara menyeluruh.
Baru-baru ini, CMC Technology Application Institute (CMC ATI) mengumumkan model CATI-VLM (Visual Document Understanding) - dibangunkan oleh pasukan penyelidik daripada gudang data besar 5TB, mengatasi banyak pesaing antarabangsa untuk mencapai 12 teratas dunia dan 1 teratas di Vietnam dalam kedudukan yang baru diumumkan oleh Pertandingan Membaca Teguh (RRC) pada DocAc2025 (RRC) pada 20 Jun. kategori.
Pertandingan Membaca Teguh (RRC) ialah taman permainan saintifik yang berprestij, (https://rrc.cvc.uab.es/) yang dianjurkan oleh Pusat Penglihatan Komputer (CVC) Universitat Autònoma de Barcelona (UAB) Sepanyol, kemudahan penyelidikan berprestij di dunia dalam bidang penglihatan komputer.
Pertandingan ini telah dimulakan pada tahun 2011 dan diadakan setiap tahun dalam rangka Persidangan Antarabangsa Mengenai Analisis dan Pengiktirafan Teks (ICDAR) - salah satu forum terkemuka dunia dalam bidang penglihatan komputer. Pertandingan ini menarik sejumlah besar penyelidik dan jurutera dari universiti, institut penyelidikan dan syarikat teknologi besar seperti Universiti Tsinghua, Hyundai Motor Group, Tencent... Masalah RRC direka untuk mempromosikan kemajuan teknologi, berkait rapat dengan masalah praktikal daripada terjemahan, pengurusan data perusahaan hingga analisis bandar dan pemprosesan dokumen sejarah.
Dr. Dang Minh Tuan, Pengarah CMC ATI berkongsi: "Kami sangat gembira kerana kapasiti penyelidikan pasukan CMC telah disahkan melalui taman permainan global yang berprestij seperti RRC. Dalam masa yang singkat, pasukan penyelidik telah mencapai kedudukan tinggi, menunjukkan daya saing antarabangsanya dengan nama-nama besar dari negara maju. Lebih penting lagi, ini adalah demonstrasi yang jelas tentang teknologi yang jelas dan keupayaan khusus dalam bidang Vietnam untuk menguasai Vietnam."
Dr Dang Minh Tuan, Pengarah CMC ATI.
CATI-VLM berbeza daripada OCR tradisional kerana ia bukan sahaja mengekstrak aksara, tetapi juga memahami pelbagai lapisan maklumat: kandungan teks, elemen bukan teks (kotak tanda, kotak semak, carta, tandatangan, formula), susun atur (struktur halaman, jadual, borang) dan gaya (fon, sorotan, dll.). Model ini boleh menjawab soalan visual yang dikemukakan pada imej dokumen, serupa dengan ChatGPT, tanpa perlu mempelajari borang tertentu terlebih dahulu.
Terutama, pada kedudukan RRC, CATI-VLM dengan hanya 3 bilion parameter mencapai ketepatan tertinggi dalam set data 4/7, mengatasi banyak model Big Tech seperti Deepseek (27 bilion parameter), GPT-4 Vision Turbo + Amazon Texttract OCR (top 34) atau Baidu (top 22).
Pencapaian itu juga menunjukkan pendekatan praktikal, memfokuskan kepada penguasaan teknologi teras, mengoptimumkan model agar sesuai dengan keadaan infrastruktur Vietnam dan bukannya mengejar skala parameter.
Contoh Borang Permohonan Kemasukan Kolej
Teks telah dikenali daripada tulisan tangan dalam imej di atas.
Encik Nguyen Trung Chinh, Pengerusi Lembaga Pengarah, Pengerusi Eksekutif Kumpulan Teknologi CMC, menekankan: "Ini adalah hasil daripada lebih sedekad pelaburan berterusan dalam penyelidikan dan pembangunan teknologi (R&D). Pencapaian tinggi CMC di taman permainan teknologi antarabangsa mengesahkan strategi menguasai teknologi Vietnam, ditambah pula dengan orientasi Transformasi AI yang kukuh. berganding bahu dengan Big Tech global, mewujudkan kedudukan yang layak pada peta teknologi dunia."
CATI-VLM akan digunakan dalam rantaian produk ekosistem C.OpenAI, termasuk: pembantu maya CLS untuk menyemak dokumen undang-undang, CMC SmartDoc - platform penukaran dokumen digital, sistem pengurusan pengetahuan CMC KMS, sistem pelaporan automatik untuk pejabat pintar dan aplikasi Dokumen Agentik generasi baharu.
QUANG HUY
Sumber: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html
Komen (0)