В контексте цифровой трансформации и трансформации приложений искусственного интеллекта, происходящих во Вьетнаме, технология OCR (оптическое распознавание символов) играет все более важную роль в оцифровке документов, автоматизации бизнес-процессов, экономии затрат и повышении эффективности управления.
Однако, учитывая особенности вьетнамского языка с его акцентом и почерком, проблема распознавания не ограничивается «чтением слов», а требует от модели способности всесторонне понимать контекст.
Столкнувшись с этой проблемой, Институт применения технологий CMC (CMC ATI) разработал модель CATI-VLM — систему понимания документов с использованием компьютерного зрения (визуальное понимание документов).
Эта модель, основанная на большом хранилище данных объемом до 5 ТБ, только что вошла в число 12 лучших в мире и в число 1 лучших во Вьетнаме на международном конкурсе Robust Reading Competition (RRC) в категории Document Visual Question Answering (DocVQA), который состоялся в июне 2025 года.
(Вьетнамское информационное агентство/Вьетнам+)
Источник: https://www.vietnamplus.vn/tri-tue-nhan-tao-viet-vao-top-12-the-gioi-ve-nhan-dang-van-ban-post1048696.vnp
Комментарий (0)