Vietnam.vn - Nền tảng quảng bá Việt Nam

ChatGPT의 새로운 추론 모델

많은 사용자들은 o3 pro가 일부 영역에서 다른 챗봇보다 우수하다고 생각합니다. 하지만 이 모델에는 큰 단점과 그 자체의 활용도가 있습니다.

ZNewsZNews16/06/2025

o3 pro는 복잡한 요청을 처리하는 능력이 뛰어납니다. 사진: OpenAI.

OpenAI는 월 200달러의 Pro 패키지와 API를 통한 Team 패키지를 출시했습니다. 몇 달 전 출시된 O3의 업그레이드 버전인 O3 Pro는 OpenAI가 지금까지 출시한 O3 중 가장 강력한 버전으로 평가하고 있습니다.

"pro" 태그가 붙은 모든 버전은 더 어렵고 긴 질문에 답할 수 있는 기능을 제공합니다. 일반 AI 버전과 달리 추론 모델은 문제를 단계별로 해결하여 물리, 수학, 프로그래밍 등의 분야에서 더욱 안정적이고 일관되게 작동할 수 있습니다.

"속도보다 신뢰성이 더 중요한 어려운 문제에는 o3-pro를 권장합니다. 몇 분 정도 기다리는 것은 그만한 가치가 있습니다."라고 회사 측은 밝혔습니다. 공유된 테스트 리뷰에서 o3-pro는 o3 및 o1-pro 버전보다 우수한 성능을 보였습니다.

전 애플 직원이자 AI 스타트업 레인드롭의 공동 창립자인 벤 하일락은 새로운 모델이 훨씬 더 스마트하다고 말했습니다. 그는 회사에서 이전에 진행된 모든 회의 기록을 수집한 후 o3-pro에 계획 수립을 의뢰했습니다.

결과는 인상적이었습니다. 그가 대규모 언어 모델(LLM)이 기대했던 것만큼 구체적이고 분석적이었습니다. 계획에는 목표 지표, 일정, 우선순위, 그리고 완전히 제거해야 할 항목에 대한 엄격한 지침이 포함되었습니다. 그는 "너무 구체적이고 현실적이라 회사의 미래를 다시 생각해야 했습니다."라고 썼습니다.

새로운 추론 모델 이미지 1

o3 pro(왼쪽)의 결과는 더욱 구체적이고 현실적입니다. 사진: Ben Hylak/X.

O3-pro는 API를 통해 사용할 경우 입력 토큰 100만 개당 20달러, 출력 토큰 100만 개당 80달러의 비용이 듭니다. 이는 AI가 데이터를 기억하고 처리하는 능력입니다. 입력 토큰 100만 개는 약 75만 단어에 해당하며, 이는 The Verge가 비교한 책 '전쟁과 평화'보다 깁니다.

OpenAI에 따르면 전문가들은 테스트된 모든 항목에서 o3 pro가 o3보다 일관되게 더 높은 평가를 내렸습니다. 평가자들은 또한 명확성, 지침 준수 용이성, 정확성 등 여러 기준에서 일관성 측면에서 o3 pro에 더 높은 평가를 내렸으며, 특히 과학, 교육 , 프로그래밍, 비즈니스, 글쓰기 지원 등 핵심 분야에서 높은 평가를 받았습니다.

모델의 수학적 능력을 평가하는 테스트인 AIME 2024에서 o3 pro는 구글의 주력 AI인 Gemini 2.5 Pro보다 높은 점수를 받았습니다. 또한, 이 모델은 박사급 과학 지식을 평가하는 테스트인 GPQA Diamond에서도 Anthropic의 Claude 4 Opus를 능가했습니다.

o3 pro에는 웹 검색, 파일 분석, Python을 활용한 계산 및 프로그래밍, 메모리 활용을 통한 개인 맞춤 응답 기능을 제공하는 내장 도구도 포함되어 있습니다. 벤 하일락은 이 도구가 주변 환경을 인식하고, 외부 세계에 대해 언제 질문해야 하는지(아는 척하는 대신), 그리고 각 작업에 적합한 도구를 선택하는 능력을 명확하게 보여준다고 말했습니다.

하지만 이 모델의 가장 큰 단점은 o1 pro보다 훨씬 느린 반응 속도입니다. 유튜버 비잔 보웬도 동의합니다. "모델의 답변은 꽤 명확하지만, 몇 문장으로만 설명하면 반응 시간이 꽤 깁니다."라고 그는 말했습니다. 특히 외부 데이터가 충분하지 않은 경우, 모델이 무작위로 생각하는 경향이 있다고 벤 하일락은 덧붙였습니다.

O3-pro는 이미지 생성 불가, Canvas 기능 지원 등 몇 가지 제한 사항이 있습니다. 이 모델을 사용하는 ChatGPT의 임시 채팅 기능은 OpenAI가 "기술적인 문제"를 해결하는 동안 현재 비활성화되어 있습니다.

하지만 Hylak 씨는 이 제품이 Claude 3.5 Sonnet이나 ChatGPT 4o처럼 사용자가 채팅하는 데 적합한 모델은 아니라고 말했습니다. Rockerbox의 제품 책임자인 Nate B. Jones는 o3 pro는 15~20분 정도 생각하는 것이 필요한 어려운 작업에 사용해야 한다고 조언했습니다.


출처: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html


댓글 (0)

No data
No data

같은 태그

같은 카테고리

불꽃놀이 폭발, 관광 활성화, 다낭, 2025년 여름 최고 성적
푸꾸옥 진주섬에서 야간 오징어 낚시와 불가사리 관찰을 경험하세요
하노이에서 가장 비싼 연꽃차를 만드는 과정을 알아보세요
호치민시에서 30톤이 넘는 도자기 조각으로 만들어진 독특한 사원을 감상하세요.

같은 저자

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품