(CLO)Facebookの親会社Metaは金曜日、AI開発プロセスにおける人間の介入を減らすことができる「自己学習評価者」を含む一連の新しいAIモデルをリリースすると発表した。
今回の発表は、Metaが8月に研究論文でこのツールを紹介した後のことだ。論文では、OpenAIの新モデルに類似した「思考連鎖」手法を用いてAIモデルの応答に関する正確な判断を行う方法について説明されている。この手法は複雑な問題をより単純な論理的ステップに分解し、科学、プログラミング、数学などの分野における精度向上に貢献する。
Meta AIアイコン。写真:ロイター
Metaの研究者は、この評価モデルをトレーニングするために完全にAI生成データを使用し、その段階での人間の介入を完全に排除しました。
2人のMeta研究者によると、AIを使ってAI自体を評価する能力は、自身の間違いから学ぶことができる自律型AIエージェントを開発する可能性を示しているという。
AI分野の多くの専門家は、これらのインテリジェントなデジタルエージェントを、人間の介入なしにさまざまなタスクを実行できるデジタルアシスタントとして想定しています。
自己改善モデルは、「人間からのフィードバックによる強化学習」プロセスの必要性を排除する可能性があります。このプロセスでは、高度なスキルを持つ専門家がデータのラベル付けを行い、複雑な数学的および文章化された回答の正確性を検証する必要があります。このプロセスは現在、非常にコストがかかり、非効率的です。
「AIが人間よりもどんどん優れるようになり、自らの作業をチェックする能力も向上し、人間の熟練度を超えるようになることを期待しています」とプロジェクトの研究者の一人、ジェイソン・ウェストン氏は語った。
「学習能力と自己評価能力は、AIを超人的なレベルにまで開発するための鍵となる」と彼は付け加えた。
Metaに加えて、GoogleやAnthropicといった企業もRLAIF(「フィードバックAIからの強化学習」)の概念に関する研究を発表しています。しかし、Metaとは異なり、これらの企業はモデルを一般向けに公開することはほとんどありません。
カオフォン(ロイター通信による)
[広告2]
出典: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
コメント (0)