生成 AI の爆発的な増加により、世界のテクノロジーの状況は完全に変化しました。
OpenAIが2022年後半にChatGPTをリリースして以来、同様のLLMモデルが次々と登場し、医療、教育、金融、法律など多くの分野に応用されています。トレーニング能力、コンピューティングインフラストラクチャ、データの面で、企業規模だけでなく国家規模でも競争が激しくなっています。
OpenAI、Google、Meta、Microsoftといった、資金力と有利な条件を備えた大企業は、LLMモデルのトレーニングの中核となるNvidia H100などのハイエンドGPUを数千台取得するために、数十億ドルを「迅速に」投資しました。この間、Nvidiaの株価は急騰し、世界のインフラ需要を反映しました。
一方、発展途上国のテクノロジー企業は、コスト問題に加え、米国からのAIチップ機器の輸出入制限にも直面しています。その結果、トレーニング機器が不足し、テクノロジー大手に比べて「遅れ」をとっています。国内展開を目指すZaloも例外ではありません。
データに関して言えば、従来の機械学習の問題では膨大な学習データが必要でしたが、大規模言語モデルでは膨大なデータ量となります。十分な精度を持つモデルを構築するには、LLMシステムは数百億、あるいは数千億もの入力テキストトークンを必要とします。一方、ベトナム語の人気度は英語や中国語に匹敵しません。このため、ベトナム語LLM開発者にとって難易度は倍増しています。
2023年には、GPT-3.5、GPT-4などの大規模言語モデル(LLM)がテクノロジーの世界に旋風を巻き起こし、多くのベトナム企業も、近道をしてLLMトレーニングプロセスを先取りするために、外国製の微調整されたモデルを選択しました。
Zaloは、より困難ではあるものの、より自律的な別の道を選びました。それは、モデルをゼロから自己学習させる(フロムスクラッチモデル)という道です。データ、モデルアーキテクチャ、学習プロセス全体に至るまで、すべてをゼロから構築する必要がある道です。この決断は、大手企業と競争するためではなく、ベトナムの人々自身の願望、つまり母国語でLLMモデルを習得するという願いを実現するためでした。
「困難は予想していましたが、それでも早期参入を決意しました。大手企業と直接競合するのではなく、より優位に立てるニッチな市場を選びました。データからアルゴリズムまで、ベトナム人が完全にコントロールできるモデルを構築することが私たちの目標です」と、Zalo AIの最高科学責任者であるグエン・チュオン・ソン博士は語りました。
インフラ、データ、そして研修レベルという3つの主要な要素において多くの障害に直面しているにもかかわらず、ベトナムのエンジニアたちは積極的に困難を克服するための解決策を見出してきました。これは、困難な状況下において、特にベトナム人向けの法学修士課程(LLM)開発のプロセスにおいて、ベトナム国民の精神力と強い意志が如実に表れていると言えるでしょう。
LLM(法学修士)を育成するには、エンジニアに適切なインフラが必要でした。しかし当時、NVIDIAのH100のようなGPUは「世界的に希少」とされていました。一方、大企業は1年間予約注文し、数百万ドルを支払って入手していました。ベトナムでは、Zaloも8台のDGX H100サーバーを購入しようとしましたが、メーカーからの納品を毎回待たなければならず、容易ではありませんでした。
NVIDIAのGPUがなかったため、ベトナムのエンジニアたちは、民生用GPUを柔軟に使い分け、コードの各行を実験し、小さなモデルを一つ一つ実行しなければなりませんでした。エンジニアたちは待つのではなく、最新の機器が揃った時に全てが準備できるよう、積極的に準備を進めました。
データに関しては、Zalo は利用可能なリソースに頼るのではなく、英語や中国語に比べて深刻な不足を補うために、ベトナム語専用の高品質データ ウェアハウスの構築に投資しました。
Zaloは柔軟な開発戦略により、大規模言語モデルの開発期間を当初の18か月から6か月に短縮することに成功しました。2023年末、ベトナムの主要なテクノロジーおよびAIコミュニティが集まるイベント「Zalo AI Summit」において、Zaloのベトナム語大規模言語モデルが正式に発表されました。このサミットで、ZaloのLLMモデルはTinhte.vnが設定したKahootチャレンジを通じてデビューし、驚くべきことにGPT 3.5を上回り、当時世界最強と考えられていたLLMモデルであるGPT4に次ぐ成績を収めました。
VMLU(ベトナム語マルチタスク言語理解ベンチマークスイート、大規模言語モデル向け)評価プラットフォームにおいて、ZaloのモデルはOpenAIのGPT-3.5の1.5倍の性能を達成しました。2024年末までに、このモデルはGPT-4(OpenAI)、Gemma-2-9B(Google)、Phi-3-small(Microsoft)といった有名モデルを凌駕し、VMLUのベトナム語処理能力ランキングではMetaのLLaMA-3-70Bに次ぐ地位を獲得するでしょう。
Zalo は研究に留まらず、LLM のアプリケーション製品を商品化し普及させることで、研究室の技術を徐々に実現しています。
2025年初頭、Zaloプラットフォームの公式アカウントとして運営されているQ&Aアシスタント「Kiki Info」は、わずか2ヶ月足らずで100万人以上のユーザーを獲得しました。また、別のアプリケーション「Thiep AI」も、わずか2ヶ月で1,500万枚のカードが作成・送信されるという驚異的な数字を達成しました。
Zaloの歩みは、単なる技術開発を目指す企業という枠にとどまりません。これは、ベトナムが科学技術開発と国家デジタル変革に関する決議57-NQ/TWに基づく政策に基づき、積極的にイノベーションを推進しているという、より大きな構想の一部です。特に、人工知能分野が重視されています。
Zalo によるベトナム人 LLM の出現と急速な発展は、ビジネスにとっての技術的な前進であるだけでなく、ベトナムの技術チームの本来の能力と忍耐力の証でもあります。
Zaloは「ゼロから」モデルを学習させる「フロム・スクラッチ」手法を採用し、長い道のりを歩みましたが、ベトナムがAIを真に習得するのを支援しました。成果だけでなく、モデルアーキテクチャ、データ、アルゴリズム、そしてアプリケーション製品に至るまでのプロセス全体においても、Zaloの成功は大きな成果をもたらしました。また、Zaloの成功は、ベトナムが東南アジアで数少ない国産LLMモデルを保有する国の一つとなることにも貢献しました。これは、ますます熾烈になるグローバルな技術競争において、戦略的なマイルストーンと言えるでしょう。
今後の長い道のりにおいて、Zaloは1つのモデルや少数の製品に留まることなく、ユーザーのニーズに応えると同時に競争力のあるベトナムAIプラットフォームを構築するために、モデルの改良を続けていきます。「ZaloのAI開発の道のりはまだ長いです。実用化を推進しながら、モデルの最適化を幅広く深く追求していきます。最終的な目標は、ベトナムの人々にとって実用的に役立つ高品質なAI製品を開発することです」とソン氏は付け加えました。
Zaloによるベトナム語LLM(法学修士)の成功は、ビジネスにおける画期的な進歩であるだけでなく、ベトナムの人工知能の未来を切り開くものです。ベトナム国民の粘り強さと向上心が、価値ある成果への道のりを導いてきました。ベトナムAIの未来は、「Zalo」だけでなく、テクノロジーの世界を継承し、征服していく勇敢なエンジニアの世代をも生み出すでしょう。
出典: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html
コメント (0)