Vietnam.vn - Nền tảng quảng bá Việt Nam

ChatGPTの新しい推論モデル

o3 Proは、多くのユーザーから、いくつかの分野で他のチャットボットよりも優れていると考えられています。しかし、このモデルには大きな欠点があり、独自の用途があります。

ZNewsZNews16/06/2025

o3 proは複雑なリクエストを処理する能力に優れています。写真:OpenAI。

OpenAIは、月額200ドルのProパッケージとAPI経由のTeamパッケージでo3 Proをリリースしました。数ヶ月前に発表されたo3のアップグレード版であるo3 Proは、同社によればこれまでで最も強力なバージョンです。

「プロ」タグの付いたバージョンはすべて、より難しく長い質問に答える能力を備えています。通常のAIバージョンとは異なり、推論モデルは問題を段階的に解決するため、物理学、数学、プログラミングなどの分野でより信頼性と一貫性を持って動作します。

同社は、「速度よりも信頼性が重視され、数分待つことにも価値がある難しい質問には、o3-proをお勧めします」と述べています。共同テストレビューでは、o3-proはo3およびo1-pro版よりも優れた性能を示しました。

元Apple社員でAIスタートアップRaindropの共同創業者であるベン・ハイラック氏は、新しいモデルははるかにスマートだと述べた。彼は社内の過去の会議の履歴をすべて収集し、o3-proにプランの作成を依頼した。

結果は実に印象的で、大規模言語モデル(LLM)に期待していた通り、具体的かつ分析的なものでした。計画には目標指標、タイムライン、優先順位、そして完全に排除すべき項目に関する厳格な指示が含まれていました。「あまりにも具体的で根拠のある内容だったので、会社の将来について考え直さざるを得ませんでした」と彼は記しています。

新しい推論モデル画像1

o3 pro(左)の結果はより具体的で根拠のあるものでした。写真:ベン・ハイラック/X

O3-proは、API経由で使用する場合、入力トークン100万個あたり20ドル、出力トークン100万個あたり80ドルかかります。これはAIがデータを記憶・処理する能力です。入力トークン100万個は約75万語に相当し The Vergeが比較した書籍『戦争と平和』よりも長いです。

OpenAIによると、専門家はテストされたすべてのカテゴリーにおいて、o3 Proをo3よりも一貫して高い評価を与えました。評価者はまた、明瞭性、指示の容易さ、正確性など、多くの基準における一貫性についてもo3 Proに高い評価を与えており、特に科学、教育、プログラミング、ビジネス、ライティングサポートといった主要分野において高い評価を得ています。

モデルの数学的能力を評価するテストであるAIME 2024において、o3 proはGoogleの主力AIであるGemini 2.5 Proよりも高いスコアを獲得しました。さらに、博士レベルの科学的知識を評価するテストであるGPQA Diamondでは、AnthropicのClaude 4 Opusを上回りました。

o3 proには、Web検索、ファイル分析、Pythonを使った計算・プログラミング、そしてメモリを活用したレスポンスのパーソナライズを可能にするツールも組み込まれています。この点について、ベン・ハイラック氏は、このツールは周囲の状況を認識し、外の世界について(知っているふりをするのではなく)いつ質問すべきか、そしてそれぞれのタスクに適したツールを選択する能力を明確に示していると述べています。

しかし、このモデルの最大の欠点は応答時間で、O1 Proよりもさらに遅い。YouTuberのビジャン・ボーエン氏も同意見だ。「モデルの答えはほんの数文の説明で非常に明確ですが、応答時間はかなり長いです」と彼は述べている。特に外部データが十分にない場合、モデルはランダムに考えてしまう傾向があると、ベン・ヒラック氏は付け加えた。

O3-proには、画像生成ができない、Canvas機能がサポートされていないなど、他にもいくつかの制限があります。このモデルを使用したChatGPTの一時的なチャット機能は現在、OpenAIが「技術的な問題」を修正している間、無効になっています。

しかし、ハイラック氏は、これはClaude 3.5 SonnetやChatGPT 4oのようなチャットユーザー向けのモデルではないと述べた。Rockerboxの製品責任者であるネイト・B・ジョーンズ氏は、o3 proは15~20分の思考を必要とする難しいタスクに使用するべきだとアドバイスした。


出典: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html


コメント (0)

No data
No data

遺産

人物

企業

No videos available

ニュース

政治体制

地方

商品