Трансформация ИИ во Вьетнаме идет полным ходом, технология OCR (оптическое распознавание символов) играет все более важную роль в оцифровке документов. Фото: Иллюстрация
Недавно Институт применения технологий CMC (CMC ATI) объявил о том, что модель CATI-VLM (визуальное понимание документов), разработанная исследовательской группой на основе хранилища данных объемом 5 ТБ, вошла в топ-12 в мире и топ-1 во Вьетнаме в рейтинге, недавно объявленном Robust Reading Competition (RRC) в июне 2025 года в категории «Визуальные ответы на вопросы по документам» (DocVQA).
Г-н Данг Минь Туан, директор CMC ATI, поделился: «Мы очень рады, что исследовательский потенциал команды CMC был подтвержден на такой престижной мировой площадке, как RRC. Мы гордимся тем, что всего за короткое время команда смогла достичь высокого рейтинга, встав плечом к плечу с известными именами из развитых стран. Что еще важнее, это наглядная демонстрация способности осваивать технологии для решения конкретных проблем вьетнамских и специализированных областей во Вьетнаме».
В контексте цифровой трансформации и внедрения искусственного интеллекта во Вьетнаме, которые активно развиваются, технология OCR (оптического распознавания символов) играет все более важную роль в оцифровке документов, автоматизации бизнес-процессов, экономии затрат и повышении эффективности управления.
Однако, учитывая особенности вьетнамского языка, такие как акцент и почерк, проблема распознавания не ограничивается «чтением слов», а требует от модели способности всесторонне понимать контекст.
CATI-VLM отличается от традиционного OCR тем, что он не только извлекает символы, но и распознает несколько слоев информации: текстовое содержимое, нетекстовые элементы (флажки, чекбоксы, диаграммы, подписи, формулы), макет (структура страницы, таблицы, формы) и стиль (шрифты, выделения…).
Модель может отвечать на визуальные вопросы, заданные на изображениях документов, подобно ChatGPT, без необходимости предварительного изучения определенных форм.
Конкурс Robust Reading Competition (RRC) — престижное научное мероприятие, организованное Центром компьютерного зрения Автономного университета Барселоны (UAB) (Испания), престижным исследовательским центром в мире в области компьютерного зрения.
Конкурс, инициированный в 2011 году и всегда сопровождающий Международную конференцию по анализу и распознаванию текста ICDAR — один из крупнейших в мире форумов по анализу документов и компьютерному зрению, стал важным событием, привлекающим исследователей, инженеров из престижных университетов, научно-исследовательских институтов и технологических компаний, таких как Университет Цинхуа, Hyundai Motor Group и Tencent...
Миссии RRC направлены на стимулирование технологического прогресса, основанного на решении практических задач: от перевода и управления корпоративными данными до городской аналитики и обработки исторических документов.
От работы до воспитания детей: как руководители технологических компаний используют ИИ каждый деньОт Дженсена Хуанга до Тима Кука — самые влиятельные руководители технологических компаний мира используют ИИ в своей повседневной жизни.
Источник: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
Комментарий (0)