Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

Основной ИИ «Сделано во Вьетнаме» вошел в 12-ю лидирующюю лигу в мире

По оценке Robust Reading Competition (RRC — престижной научной площадки в мире) модель распознавания текста изображений CATI-VLM, продукт «Сделано во Вьетнаме», входит в 12 лучших в мире.

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp03/07/2025



В контексте цифровой трансформации и развития искусственного интеллекта (ИИ) во Вьетнаме технология OCR (оптического распознавания символов) играет всё более важную роль в оцифровке документов, автоматизации бизнес-процессов, сокращении затрат и повышении эффективности управления. Однако, учитывая особенности вьетнамского языка, включая акцент и почерк, проблема распознавания не ограничивается «чтением слов», а требует от модели способности всесторонне понимать контекст.

Недавно Институт применения технологий CMC (CMC ATI) объявил о том, что модель CATI-VLM (визуальное понимание документов), разработанная исследовательской группой на основе хранилища данных объемом 5 ТБ, вошла в топ-12 в мире и топ-1 во Вьетнаме в рейтинге, недавно объявленном Robust Reading Competition (RRC) в июне 2025 года в категории «Визуальные вопросы и ответы по документам» (DocVQA).

Подпись к фотографии

Рейтинг RRC в категории DocVQA 6/2025.

Конкурс Robust Reading Competition (RRC) – престижная научная площадка (https://rrc.cvc.uab.es/), организованная Центром компьютерного зрения (CVC) Автономного университета Барселоны (UAB), Испания, авторитетным исследовательским центром в мире в области компьютерного зрения. Запущенный в 2011 году и неизменно сопровождающий Международную конференцию по анализу и распознаванию текста (ICDAR) – один из крупнейших в мире форумов по анализу документов и компьютерному зрению, конкурс стал важным событием, привлекающим исследователей, инженеров из престижных университетов, исследовательских институтов и технологических компаний, таких как Университет Цинхуа, Hyundai Motor Group и Tencent... Задачи RRC направлены на содействие технологическому прогрессу, тесно связанному с практическими задачами – от перевода и управления корпоративными данными до анализа городской среды и обработки исторических документов.

Доктор Данг Минь Туан, директор CMC ATI, отметил: «Исследовательский потенциал команды CMC подтверждается такой престижной международной площадкой, как RRC. Мы гордимся тем, что за столь короткое время команда смогла достичь высокого рейтинга, встав плечом к плечу с известными именами из развитых стран. Что ещё важнее, это наглядно демонстрирует способность осваивать технологии для решения специфических проблем вьетнамской науки и специализированных областей во Вьетнаме».


CATI-VLM отличается от традиционного OCR тем, что не только извлекает символы, но и распознаёт несколько слоёв информации: текстовое содержимое, нетекстовые элементы (флажки, чекбоксы, диаграммы, подписи, формулы), макет (структуру страницы, таблицы, формы) и стиль (шрифты, выделение и т. д.). Модель может отвечать на визуальные вопросы, заданные на изображениях документов, подобно ChatGPT, без необходимости предварительного изучения конкретных форм.



По данным газеты News and People

Источник: https://doanhnghiepvn.vn/cong-nghe/ai-loi-make-in-vietnam-duoc-xep-hang-top-12-the-gioi/20250703100726051


Комментарий (0)

No data
No data

Та же тема

Та же категория

Итоги учений A80: сила Вьетнама сияет под покровом ночи тысячелетней столицы
На дорогах Ханоя после сильного дождя водители бросают машины на затопленных дорогах
Впечатляющие моменты дежурства лётного состава на торжественной церемонии запуска A80
Более 30 военных самолетов впервые выступят на площади Бадинь

Тот же автор

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт