3月14日午前、ベトナム国立イノベーションセンター(NIC)は、ベトナムにおける人工知能(AI)の発展を促進することを目的とした2025イノベーションチャレンジプログラムを開始した。
イノベーション チャレンジ 2025 は、大規模言語モデル (LLM) のトレーニング、評価、および効率性の向上を目的とした高品質のオープンソース ベトナム語データセットを作成する取り組みとして、ViGen プロジェクトに重点を置いています。
ベトナム語データセットは、AIモデルがベトナムの文化、文脈、表現をより深く理解するのに役立つことを目的としています。このプロジェクトにより、AI開発におけるベトナム人の存在感が高まり、デジタル経済の促進に貢献することが期待されます。

ViGenプロジェクトは、Meta Group、NIC、そして「AI for Vietnam」という組織による三者協力から生まれました。この中で、国立イノベーションセンターは、プロジェクトの管理、調整、そしてベトナムの国家目標との整合性確保の役割を担っています。
ViGen プロジェクトの使命は、ベトナムにおける AI アプリケーションの可能性を最大限に引き出すために、AI モデルがベトナム語を根本から自然かつ包括的にサポートできるようにすることです。
ViGen は、AI モデルの機能をトレーニングおよび評価するために、大規模で高品質なオープンソースのベトナム語データセットを構築します。
ViGen プロジェクトは、ベトナムの AI 開発が文化的価値観や倫理基準と整合していることを保証し、地域に適切で責任あるオープンソース AI エコシステムの構築を目指しています。
Meta は、このプロジェクトをサポートするために、モビリティとソーシャル接続に関する洞察や、AI を活用した人口マップのトレーニング データなど、オープンソース データセットを提供します。
国立イノベーションセンター副所長のヴォ・スアン・ホアイ氏によると、AIは世界を変革しているとのことです。そのため、AIのトレーニングと評価のための大規模で高品質なオープンソースのベトナムデータセットの開発は、喫緊の課題となっています。
「 ViGenプロジェクトは、科学技術、イノベーション、そして国家のデジタル変革における飛躍的進歩を促進するという 政治局決議第57号に沿ったものです。政策立案者、研究者、開発者、専門家、そしてユーザーの共同の努力により、AIをすべてのベトナム国民にとって強力なツールに変え、ベトナムを世界的なAI大国にすることを目指します」と、国家イノベーションセンター副所長は述べた。

ベトナム語は1億人以上が使用していますが、AIモデルの学習に使用されているベトナム語データは現在、1%未満と非常に少ない割合にとどまっています。そのため、AIモデルの出力は情報価値はあるものの、自然ではなく、ベトナム語の価値を十分に伝えることができず、有用性が低く、効果が低いという問題が生じています。
AI for Vietnamの創設者兼CEOであるトラン・ヴィエット・フン氏は、次のように述べています。「 ViGenプロジェクトは、ベトナム語の大規模で高品質なデータセットをコミュニティに貢献し、AIではあまり存在感のない言語と考えられているベトナム語の現状を改善します。」
Tran Viet Hung氏によると、ViGenプロジェクトはLlamaのようなオープンソースモデルの力と価値を示しており、ベトナム語の文脈を考慮した革新的なソリューションの開発を可能にしているという。
実際、ベトナムでは、Llama大規模言語モデルをベースに開発されたベトナム語のバーチャルアシスタントが登場しています。例えば、情報検索を自動化するMisaのバーチャルアシスタントや、Viettelの法律関連バーチャルアシスタントなどが挙げられます。これらは、ベトナム人の生活、特に公共部門におけるAIの応用を示す初期の例です。

コメント (0)