ChatGPT의 새로운 추론 모델

o3 pro는 복잡한 요청을 처리하는 능력이 뛰어납니다. 사진: OpenAI.

OpenAI는 월 200달러의 Pro 패키지와 API를 통한 Team 패키지를 출시했습니다. 몇 달 전 출시된 O3의 업그레이드 버전인 O3 Pro는 OpenAI가 지금까지 출시한 O3 중 가장 강력한 버전으로 평가하고 있습니다.

"pro" 태그가 붙은 모든 버전은 더 어렵고 긴 질문에 답할 수 있는 기능을 제공합니다. 일반 AI 버전과 달리 추론 모델은 문제를 단계별로 해결하여 물리, 수학, 프로그래밍 등의 분야에서 더욱 안정적이고 일관되게 작동할 수 있습니다.

"속도보다 신뢰성이 더 중요한 어려운 문제에는 o3-pro를 권장합니다. 몇 분 정도 기다리는 것은 그만한 가치가 있습니다."라고 회사 측은 밝혔습니다. 공유된 테스트 리뷰에서 o3-pro는 o3 및 o1-pro 버전보다 우수한 성능을 보였습니다.

전 애플 직원이자 AI 스타트업 레인드롭의 공동 창립자인 벤 하일락은 새로운 모델이 훨씬 더 스마트하다고 말했습니다. 그는 회사에서 이전에 진행된 모든 회의 기록을 수집한 후 o3-pro에 계획 수립을 의뢰했습니다.

결과는 인상적이었습니다. 그가 대규모 언어 모델(LLM)이 기대했던 것만큼 구체적이고 분석적이었습니다. 계획에는 목표 지표, 일정, 우선순위, 그리고 완전히 제거해야 할 항목에 대한 엄격한 지침이 포함되었습니다. 그는 "너무 구체적이고 현실적이라 회사의 미래를 다시 생각해야 했습니다."라고 썼습니다.

새로운 추론 모델 이미지 1

o3 pro(왼쪽)의 결과는 더욱 구체적이고 현실적입니다. 사진: Ben Hylak/X.

O3-pro는 API를 통해 사용할 경우 입력 토큰 100만 개당 20달러, 출력 토큰 100만 개당 80달러의 비용이 듭니다. 이는 AI가 데이터를 기억하고 처리하는 능력입니다. 입력 토큰 100만 개는 약 75만 단어에 해당하며, 이는 The Verge가 비교한 책 '전쟁과 평화'보다 깁니다.

OpenAI에 따르면 전문가들은 테스트된 모든 항목에서 o3 pro가 o3보다 일관되게 더 높은 평가를 내렸습니다. 평가자들은 또한 명확성, 지침 준수 용이성, 정확성 등 여러 기준에서 일관성 측면에서 o3 pro에 더 높은 평가를 내렸으며, 특히 과학, 교육 , 프로그래밍, 비즈니스, 글쓰기 지원 등 핵심 분야에서 높은 평가를 받았습니다.

모델의 수학적 능력을 평가하는 테스트인 AIME 2024에서 o3 pro는 구글의 주력 AI인 Gemini 2.5 Pro보다 높은 점수를 받았습니다. 또한, 이 모델은 박사급 과학 지식을 평가하는 테스트인 GPQA Diamond에서도 Anthropic의 Claude 4 Opus를 능가했습니다.

o3 pro에는 웹 검색, 파일 분석, Python을 활용한 계산 및 프로그래밍, 메모리 활용을 통한 개인 맞춤 응답 기능을 제공하는 내장 도구도 포함되어 있습니다. 벤 하일락은 이 도구가 주변 환경을 인식하고, 외부 세계에 대해 언제 질문해야 하는지(아는 척하는 대신), 그리고 각 작업에 적합한 도구를 선택하는 능력을 명확하게 보여준다고 말했습니다.

하지만 이 모델의 가장 큰 단점은 o1 pro보다 훨씬 느린 반응 속도입니다. 유튜버 비잔 보웬도 동의합니다. "모델의 답변은 꽤 명확하지만, 몇 문장으로만 설명하면 반응 시간이 꽤 깁니다."라고 그는 말했습니다. 특히 외부 데이터가 충분하지 않은 경우, 모델이 무작위로 생각하는 경향이 있다고 벤 하일락은 덧붙였습니다.

O3-pro는 이미지 생성 불가, Canvas 기능 지원 등 몇 가지 제한 사항이 있습니다. 이 모델을 사용하는 ChatGPT의 임시 채팅 기능은 OpenAI가 "기술적인 문제"를 해결하는 동안 현재 비활성화되어 있습니다.

하지만 Hylak 씨는 이 제품이 Claude 3.5 Sonnet이나 ChatGPT 4o처럼 사용자가 채팅하는 데 적합한 모델은 아니라고 말했습니다. Rockerbox의 제품 책임자인 Nate B. Jones는 o3 pro는 15~20분 정도 생각하는 것이 필요한 어려운 작업에 사용해야 한다고 조언했습니다.

출처: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html