Vietnam.vn - Nền tảng quảng bá Việt Nam

ベトナムの人工知能、テキスト認識で世界トップ12にランクイン

CATI-VLMモデルは、2025年6月に開催された国際ロバスト読解コンテスト(RRC)の文書ビジュアル質問応答(DocVQA)部門で、世界トップ12、ベトナムトップ1にランクされました。

VietnamPlusVietnamPlus09/07/2025


0907-ai-ベトナム.jpg

ベトナムではデジタルトランスフォーメーションと人工知能アプリケーションの変革が盛んに行われており、OCRテクノロジー(光学式文字認識)は、文書のデジタル化、ビジネスプロセスの自動化、コストの削減、管理効率の向上においてますます重要な役割を果たしています。

しかし、アクセントや手書き文字のあるベトナム語の特性を考えると、認識の問題は「単語の読み取り」に留まらず、モデルが文脈を総合的に理解する能力を持つことが求められます。

この課題に直面して、 CMCテクノロジー アプリケーション インスティテュート (CMC ATI) は、コンピューター ビジョン (Visual Document Understanding) を使用してドキュメントを理解するシステムである CATI-VLM モデルを開発しました。

最大 5TB の大規模データ ウェアハウスをベースにしたこのモデルは、2025 年 6 月に開催された国際 Robust Reading Competition (RRC) の Document Visual Question Answering (DocVQA) 部門で、世界トップ 12 位、ベトナムトップ 1 位にランクされました。

(ベトナム通信社/ベトナム+)

出典: https://www.vietnamplus.vn/tri-tue-nhan-tao-viet-vao-top-12-the-gioi-ve-nhan-dang-van-ban-post1048696.vnp


コメント (0)

No data
No data
ヴィンヒー湾の詩的な美しさを発見
ハノイで最も高価なお茶(1kgあたり1000万ドン以上)はどのように加工されるのでしょうか?
川沿いの地域の味
ベトナムの海に昇る美しい日の出
トゥランの雄大な洞窟アーチ
蓮茶 - ハノイの人々からの香り豊かな贈り物
今朝、全国1万8000以上の仏塔が鐘と太鼓を鳴らし、国の平和と繁栄を祈った。
漢江の空は「まさに映画のよう」
2024年のミス・ベトナムはフーイエン出身の少女、ハ・チュク・リンさんに選ばれた
DIFF 2025 - ダナンの夏の観光シーズンを爆発的に促進

遺産

仕事

No videos available

ニュース

政治体制

地元

製品