ソーシャルメディア大手のMetaは、AI開発プロセスにおける人間の介入を縮小できる自己学習評価(STE)機能を備えた新しいAIモデルを発表した。
8月に導入されたこのツールは、OpenAIが最近リリースしたo1モデルに似た「思考トレイン」を使用しており、アルゴリズムがより信頼性の高い判断を下すのに役立ちます。
この手法の原理は、複雑な問題をより小さな論理的ステップに分解し、科学、プログラミング、数学などの難しい分野での応答精度を向上させる可能性があることです。
現在、AI モデルは一般的に人間からのフィードバックによる強化学習を受けますが、このプロセスはコストがかかり非効率的で、データに正確にラベルを付けたり、高精度のクエリに対する回答を検証したりするために人間の専門家が必要になることがよくあります。
「AIが超人的なレベルに近づくにつれ、AIが自らの作業を自己チェックできるようになることを期待しています」とMetaの研究チームのジェイソン・ウェストン氏は語った。
GoogleやAnthropicなどの他の企業も、フィードバック強化学習(RLAIF)の概念に関する研究を発表しています。しかし、これまでのところ、これらのモデルを一般公開しているのはMetaだけです。
さらに、Meta は Segment Anything 画像認識モデルのアップデートもリリースしました。これにより、新しい無機材料の研究に使用できるデータの生成が高速化されます。
先週、フェイスブック傘下の巨大企業は、「パージ」や「ゲット・アウト」などのホラーシリーズで知られる映画製作会社ブラムハウス・プロダクションズと提携し、同社の動画生成AIモデル「Movie Gen」をテストした。
Movie Genは、OpenAIやElevenLabsなど、業界をリードする他のスタートアップ企業のサービスに匹敵するリアルなビデオとオーディオを作成できると言われています。
(Yahoo Techによると)
[広告2]
出典: https://vietnamnet.vn/meta-ra-mat-mo-hinh-ai-tu-danh-gia-hoc-hoi-2333881.html
コメント (0)