この製品はベトナムの科学技術分野ですぐに話題を呼びました。

ベトナムの問題を解決するために困難な道を選ぶ

2022年末、ChatGPTは「ビッグバン」を起こし、テクノロジー分野の各国や大手企業の間でAI覇権をめぐる競争が勃発しました。当時、ベトナムのテクノロジーコミュニティも、ベトナム製品の開発において技術面での自立を目指し、海外製品への依存度を下げることに熱心に取り組んでいました。しかし、VinBigdataのように、その願望を実現できる能力と決意を持つ企業はそう多くありません。

「生成AIは難しい問題です。OpenAIやGoogleのような大企業も、私たちが目にするような製品を開発するために、多くのリソースと時間を研究に費やしています。これらの製品は非常に優れていますが、実際には、科学者たちはまだその動作メカニズムを完全に理解していません。いつエラーが発生するのか、そしてどのようなエラーが発生するのかを予測できる人はほとんどいません。1年未満という短期間で、ベトナム人向けにChatGPTに似た製品を開発するには、多くの課題があります。しかし、私たちは『リスク』を負うことを選びました。なぜなら、ベトナム人がChatGPTのベトナム版を作らなければ、誰が作るのでしょうか?」と、VinBigdataの科学ディレクターであるVu Ha Van教授は語りました。

実際、大規模言語モデルをゼロから構築することを選択する企業はごくわずかです。例えば、OpenAIのGPT 3は1750億のパラメータを持ち、45テラバイトのデータセットで学習され、460万ドルの費用がかかりました。試算によると、GPT 4の開発コストは最大1億ドルに達する可能性があります。「これほど膨大な数になると、この技術に投資できる企業を見つけるのは非常に困難です」と、VinBigdataのプロダクトディレクターであるNguyen Kim Anh博士は述べています。

写真1.jpg

ベトナム企業が最適なコストとインフラで新世代AI技術にアクセスできるようにするため、VinBigdataは全く異なる方向性を選択しました。それは、わずか16億のパラメータを持つ言語モデルでありながら、数十億のパラメータを持つ大規模言語モデルと同等の機能を持つ言語モデルを構築するというものです。「VinBigdata自身が開発したアーキテクチャを用いることで、言語モデルのトレーニングプロセスを最適化・加速し、インフラコスト(トレーニングコストと利用コストを含む)を削減しながらも、モデルの品質を確保することが完全に可能であることが結果から示されています」と、グエン・キム・アン博士は付け加えました。

大規模な言語モデルのサイズの問題を解決した後、ViGPT を「考案」する過程で、外国のモデルを研究した後、VinBigdata チームは統計確率モデルの固有の性質から生じる「錯覚」という別の課題にも気づきました。

そのため、世界最大級の言語モデルは英語のデータソースで学習されることが多く、その結果、ベトナム人の文脈や文化を実際には理解し、正しく反応することができません。その結果、大規模な言語モデルは誤った回答を「捏造」してしまうという幻覚状態に陥ります。

写真3.jpg

最短時間で最適なソリューションを見つけるために、VinBigdata の自然言語処理 (NLP) チームは小グループに分かれ、さまざまなアイデアを分析および議論して、最も適切な最終方向性を見つけました。

「最終的に、私たちは現在の大規模言語モデルとは異なるアーキテクチャを開発し、600GBの微調整されたベトナム語データセットでトレーニングを実施して、ベトナム人の文脈を理解し、それに応じた回答を提供できる「インテリジェントな仮想アシスタント」を作成することにしました」とグエン・キム・アン博士は付け加えた。

ベトナムのテクノロジーエコシステムへの憧れ

ベトナム語能力評価基準(VMLU)の評価結果によると、ViGPTは平均42.24%のスコアを獲得し、ChatGPT(48.54%)に次ぐ2位となりました。この結果により、ViGPTはベトナムの特定のトピックに関する情報を迅速に検索し、質問に答えることができます。

開発チームは、バーチャルアシスタントの機能に加え、ViGPTを身近な日常製品に統合し、ベトナムの人々の生活に変化をもたらすことを目指しています。これが、VinBigdataチームがViGPTを活用した言語・音声製品のエコシステムを構築する原動力となっています。「Vi」エコシステムには、ViChat、ViVoice、ViViバーチャルアシスタントが含まれます。これらの製品は、自動車産業、銀行金融、保険、運輸など、様々な業界で活用できます。

「テクノロジー、特にAIに取り組む際、私たちは単に目に見えない、興味深く複雑なシステムを征服したいだけではありません。AIが生活に変化をもたらす直接的な主体となる、具体的で応用性の高い製品を作りたいのです」と、VinBigdataのプロダクトディレクターは断言しました。

画像4.jpg

したがって、ViGPTの開発成功は、「純粋にベトナム産」の技術とデータを数百万人のベトナム人の生活に役立てるための道のりの第一歩に過ぎません。VinBigdataの代表者は、この部門はViGPTをVinBase 2.0マルチコグニティブ人工知能プラットフォームに統合し、様々な規模や業種の組織や企業に優れたソリューションを提供することを目指していると述べました。

ViGPT 以前には、言語および音声処理テクノロジーの分野の専門家とエンジニアのチームである VinBigdata が、ベトナム初の総合的な仮想アシスタントである ViVi ( VinFast電気自動車、Vinhomes Resident アプリケーション、および Vinhomes Online 電子商取引プラットフォームに適用および展開) のリリースで名声を博し、同時に、音声生体認証や音声クローニングなどの世界最先端のテクノロジーを完全に習得しました。

これらの技術はすべて、VinBigdataによって収集、分析、改良された、主にベトナム固有のデータに重点​​を置いた3,500テラバイトのデータベースに基づいて開発されています。最終的な目標は、ベトナムのデータと知識システムを活用して、世界の技術をベトナムの生活に取り入れることです。

ViGPTは、VinBigdataが開発したベトナム語大規模言語モデル(LLM)をベースに構築された、エンドユーザー向けの初の「ベトナム語版ChatGPT」です。ViGPTは優れた機能を備え、コンテンツ作成、情報検索、ベトナム特有のよくある質問への回答など、ベトナム人のニーズに最適な設計となっています。ViGPTはvigpt.vinbigdata.comで登録してお試しください。

タン・ハ