上記の内容は、最近の ViGPT 発表イベントの傍らで行われた記者とのディスカッションの中で、VinBigdata の科学ディレクターである Vu Ha Van 教授によって語られたものです。

アンフハヴァン.jpg
VinBigdata の最高科学責任者、Vu Ha Van 教授。

ViGPTは技術者とコミュニティからの貢献を必要としています

ヴー・ハ・ヴァン教授は、Googleのような大企業が大規模な言語を開発する際には、英語かフランス語を主要言語として選択するだろうと述べた。ベトナム語もあるが、検索結果の表示は他の言語に比べて遅くなる。ベトナム語からの質問に対するこれらの大規模言語モデルの回答は、ある程度、完全かつ正確ではないだろう。

そのため、VinBigdataは、時間の経過とともに、ViGPTが文化、歴史、地理など、ベトナム人に特有の情報に直接関連する質問において、精度においてViGPTを上回ることを期待しています。これは、ベトナム語モデルの作成者が将来的に目指していることであり、ベトナム人に関する質問をする際に、外国人に関する質問よりも優れた比較情報源となるでしょう。

さらに深く掘り下げると、VinBigdataのサイエンスディレクターは、例えば 政治的に「デリケートな」時期にチュオン・サとホアン・サの歴史に関する質問を分析したところ、GoogleやOpenAIからの回答が、これらの企業の創設者やその背後にいる人々の政治的偏見を反映させないことを保証するのは非常に困難でした。ベトナムには他にも選択肢があるので、この問題について検討した方が良いでしょう。

「ベトナム人向けの大規模言語モデルを構築する私たちの目的は、ベトナム人に最善の答えをもたらすことです。私たちは彼らの目的を知ることはできません」とヴー・ハ・ヴァン教授は語った。

ViGPTはChatGPTやGoogle Bardほどには多くの機能を実現できないことを認めています。これらの企業の投資率と実装にかかる時間は、これらの企業の数千倍にも上ります。しかし、Vu Ha Van教授は、「誰の国旗に金色の6文字が刺繍されているか?」といったベトナムに偏った質問に対しては、ViGPTはTran Quoc Toanと答える一方で、他のバージョンは間違っている可能性があると述べています。今後、このような詳細な質問に対して、国内ユーザーからのフィードバックがあれば、ViGPTはより良い結果を出すでしょう。

「もしユーザーが批判ばかりしたり、10歳の子供が知らない質問を知っているのにこのビッグ言語モデルは相変わらず愚かだと考えたり、私たちがAIより賢いことを証明するためにひっかけ質問をしたりするなら、私たちはAIより賢いですが、それは何の目的もありません。私たちは製品をより良くするのではなく、製品を作る人々をより悲しませるだけです。そのため、VinBigdataは技術者とコミュニティの共通の貢献を必要としています。製品を単なるサービスツールにとどまらず、ベトナム国民の誇りとなるよう、製品を完成させるためにベトナム国民の協力が必要です」と、Vu Ha Van教授は強調しました。

ベトナム語モデルをサポートし、伴走する準備が整いました

ベトナムでAIに取り組んでいるスタートアップ企業の代表者は、 VietNamNetの取材に対し、VinBigdataのベトナム語モデルをサポートし、協力する用意があると語った。

ViGPT.jpg
大規模なベトナム語モデルを開発するには、ViGPT のサポートと付随が不可欠です。

Aicontent.vnプラットフォームを所有するUnikon Joint Stock CompanyのCTO、ディン・トラン・トゥアン・リン氏は、現在アジア諸国で大規模言語モデルの学習に成功している国は多くなく、中国、韓国、日本などがその先頭に立っていると述べています。そのため、ViGPTはベトナム国民のコア技術への投資努力にとって重要なシグナルとなります。ディン・トラン・トゥアン・リン氏によると、千里の道も一歩から始まるとのことです。AI応用のパイオニアとして、UnikonはViGPTへの貢献、テスト、フィードバックの提供、そして適切な規模のプロジェクトへの活用にも積極的に取り組んでいく考えです。

一方、Lovinbotの共同創設者であるダン・フー・ソン氏は、VinBigdataがコミュニティや専門家の意見に耳を傾けていることは、ベトナム人に特化した大規模な言語モデルを開発する上で非常に良いことだと述べました。技術者として、ダン・フー・ソン氏は製品の使用後、VinBigdataの技術チームにフィードバックを提供しました。

ダン・フー・ソン氏によると、新しく発売された製品はすぐに完成するものではなく、コミュニティからの完全なサポートをすぐに得られるわけでもない。ベトナム人は長い間、その技術はベトナムには無理だと思っていたため、まだ時間が必要だ。同時に、VinBigdataはコミュニティがどのようにサポートし、より良い形で寄り添うことができるかについて、具体的な指示を出す必要がある。

Mindmaidプラットフォームの創設者であるダン・フー・ロック氏は、現在、母語モデルを構築している国は世界でも非常に少ないと述べました。インドのような情報技術力の高い豊かな国や、インドネシアや中東などベトナムよりもGDPの高い国でさえも、言語の特性にも左右されるため、単にやりたいからといって母語モデルを構築できるわけではありません。そのため、より広い視点から見ると、ベトナムは母語モデルの構築において戦略的優位性を持っており、これはベトナム人が世界で競争していく上での戦略的優位性となるでしょう。

ダン・フー・ロック氏によると、ベトナム語の大規模言語モデル構築に向けたあらゆる取り組みは価値があり、現状の欠点を理由に国内技術部門の努力をすべて否定するのではなく、モデルを日々より完璧なものにするために具体的な方法で論評する必要があるとのことです。ベトナム人も、ベトナム語の大規模言語モデルを現在世界最高の大規模言語モデルと比較するのではなく、AI時代における大規模言語技術の重要性を広く伝え、それをどのように応用して自国とベトナム企業に価値を生み出すかについて議論を深めるべきです。大規模言語は汎用的なAI技術であるため、この問題には不向きかもしれませんが、他の具体的な問題には適しています。特に、ベトナム語の理解と生成に関する問題では、ベトナム語の大規模言語モデルがより大きな優位性を持つでしょう。

コミュニティ版ViGPTは、非営利団体に無料で提供されます。コミュニティ版ViGPTは、VinBigdataから非営利団体に無料で提供されます。ただし、このバージョンを使用する組織は、導入時にクラウドなどのインフラコストを負担する必要があります。