米国を離れて帰国したVILMのグエン・ホアン・クアン氏と彼の同僚は、ベトナム人が顧客ケア分野で使用できる無料の人工知能(AI)システムを開発し、毎月数十万回以上ダウンロードされている。
2023年6月、25歳のグエン・ホアン・クアンは、同僚のZaloAIの人工知能エンジニアである23歳のファム・ニュット・フイ、アイルランドのコーク大学の博士課程の学生である24歳のダオ・ミン・ユンとともに、ベトナムの人々が最先端のAI技術を最適な方法で体験できるように支援するという願いから、非営利団体VILMを共同設立しました。
約6ヶ月にわたる研究と応用を経て、チームはOpenHermes、VinaLlama、Vistralを含む3つの無料AIモデルの開発に成功しました。これらは、ユーザーの意図を理解し、それに応じて行動できるAIシステム(大規模行動モデル)の開発に向けた基礎研究です。これらのモデルは、機械制御、介護者なしで障がい者をより良くサポートするロボット、プログラマーのエラー修正を支援するロボット、顧客の対応や無料の質問を行うバーチャルアシスタントなどの技術分野に応用されています。
OpenHermesは月間85,000ダウンロードに達し、HuggingFace(世界最大のAIモデル共有サイト)で最もダウンロードされた言語モデルのトップ10にランクインしました。スクリーンショット
OpenHermesモデルは、ChatGPTと同様に英語に対応した大規模言語モデルですが、ChatGPTよりも優れたスコアを誇ります。ユーザーはモデルをパソコンにダウンロードして、インターネットに接続せずに使用できます。特筆すべきは、OpenHermesの学習データ量は、OpenAIのChatGPTの学習データ量のわずか100分の1であることです。現在、このアプリケーションは月間5万回以上ダウンロードされています。OpenHermes-2.5とOpenHermes-2.5-Visionは、米国シリコンバレーの40社以上のスタートアップ企業で利用されています。
VinaLlama と Vistral は、ベトナム市場へのサービス提供に重点を置いた 2 つの言語モデルであり、国内ユーザーが最先端の AI テクノロジーをより簡単に体験できるようにすることを目的としています。
ホアン・クアンは7年間アメリカで学び、大学を卒業していないにもかかわらず、OpenAIでChatGPT人工知能モデルのリサーチエンジニアとして働いていました。2022年には、MicrosoftとOpenAIのBing Chat製品でデータエンジニアとして働き、数千ドルの収入を得ました。2023年、アメリカでテクノロジー業界のレイオフの波に直面したクアンは、卒業後の就職市場が非常に厳しいことに気づきましたが、ベトナムでチャンスを見つけ、帰国を決意しました。
グエン・ホアン・クアン。写真: NVCC
VILMでは、Quan氏がチーフエンジニアとしてデータ強化技術とAIトレーニングの研究を担当しています。一方、Nhut Huy氏はAIトレーニングにおける技術研究を担い、Minh Dung氏は理論研究において新たな手法を提案しています。
クアン氏は、ChatGPT(大規模言語モデル)などの現在の大規模言語モデルはテキスト出力しか提供できないのに対し、人間にはコミュニケーションや知識獲得のための様々な方法があると説明した。そのため、チームは言語レベルにとどまらず、異なる種類の入出力間で柔軟に動作できるシステム(言語、画像、動画、音声など、異なる種類のデータを送受信できるシステム)の構築を目指している。
大規模アクションモデルの構築という目標を達成するために、チームはセキュリティと速度という2つの問題を克服する必要がありました。現在のAIアプリケーションは、主にユーザーデータを使用し、OpenAIなどの企業のサーバーに送信して処理するため、セキュリティ上の懸念が生じます。チームは、ユーザーエクスペリエンスに影響を与えないようにパフォーマンスと速度のバランスを取りながら、モバイルデバイスで直接処理できるほど小型で高速なAIモデルの作成に注力しました。
実験チームは、現実のソースからのデータを使用するのではなく、AIが生成したデータを用いてAI自体を学習させました。当初は計算リソース(AIを学習するためのコンピューター)の確保に苦労しましたが、その後、世界中の大企業や研究所から資金提供を受けることができました。
クアン氏は、これらの製品を開発する主な目的は、ChatGPTやBing Chatに劣らない品質でAIアプリケーションに迅速かつ容易にアクセスできるようにすること、そして将来的なAIモデルの研究と開発をより容易にすることだと述べた。ベトナムの企業は、ベトナム語と文化に制限のあるChatGPTを使用する代わりに、ベトナム語版のVinaLlamaをダウンロードすることができる。
VinaLlama言語モデルはベトナム語の数学問題を簡単に処理します。写真は、VinaLlama製品が数学問題を解くデモです。スクリーンショット。
AIチャットボット構築プラットフォーム「Mindmaid」の創設者であるダン・ハイ・ロック氏は、AIアプリケーション開発者の視点から、企業がAIアプリケーションを導入する際に最も懸念する2つの問題はコストとデータプライバシーであると認識していると述べています。この問題に対する最も満足のいく解決策は、企業のインフラ上で実行でき、企業独自のデータをより深く学習(微調整)できるオープンソースのLLMモデルです。そのため、VinaLlama、VistralなどのベトナムのオープンソースLLMモデルは、ベトナムにおけるAIアプリケーションの普及において非常に価値があります。
「これらのオープンソースモデルにより、より多くのプログラマーや技術愛好家が、高価なGPU(グラフィックカード)インフラに投資することなく、MacBookだけでAIエンジニアの分野にアクセスできるようになります。これは、近い将来需要が高まるベトナムのAIエンジニアの育成にもつながるでしょう」とLoc氏は述べています。
クアン氏によると、ベトナム人は科学理論の基礎が非常に優れており、AIにも長けており、ChatGPTにも研究に参加する人材はいるものの、絶えず変化する技術の波に素早く追いつくのが困難だという。「ベトナム人に必要なのは、エンドユーザーが直面する問題を真に理解し、研究を適切に方向づけるための製品開発経験です」と、クアン氏はベトナム人の技術支援のために無料のAIモデルを研究する理由について述べた。彼はこれまで多くの国際グループと協力しており、ベトナムの研究グループとも常に協力する用意があると述べた。
ヌー・クイン
[広告2]
ソースリンク
コメント (0)