Apple, Microsoft, Meta, Google은 모두 최근에 "매개변수"는 적지만 여전히 강력한 기능을 갖춘 새로운 AI 모델을 출시했습니다. 이는 재정적으로 어려운 기업이 AI를 사용하도록 장려하기 위한 기술 그룹의 노력의 일환입니다.
일러스트: FT
일반적으로 매개변수의 수가 많을수록 AI 소프트웨어의 성능이 향상되고 작업의 복잡성과 정교함이 높아집니다. 이번 주에 발표된 OpenAI의 최신 GPT-4o 모델과 구글의 Gemini 1.5 Pro는 모두 1조 개가 넘는 매개변수를 가진 것으로 추산됩니다. 한편, Meta는 오픈소스 Llama 모델의 4,000억 개의 매개변수를 가진 버전을 학습시키고 있습니다.
데이터 및 저작권 책임에 대한 우려로 인해 Meta와 Google과 같은 Big Tech 회사는 몇 십억 개의 매개변수만으로 구성된 소규모 언어 모델을 출시했습니다. 이러한 모델은 저렴하고 에너지 효율적이며 사용자 정의가 가능하고 학습 및 실행에 필요한 에너지가 적으며 민감한 데이터가 저장되는 것을 방지할 수도 있습니다.
Microsoft의 Azure AI 플랫폼 부문 부사장인 에릭 보이드는 "더 낮은 비용으로 높은 품질을 제공함으로써 실제로 고객이 액세스할 수 있는 애플리케이션이 더 많아집니다."라고 말했습니다. Azure AI 플랫폼은 기업에 AI 모델을 판매합니다.
Google, Meta, Microsoft, 그리고 프랑스 스타트업 Mistral도 소규모 언어 모델을 출시했지만, 여전히 진전을 보이고 있으며 특정 작업에 더 집중할 수 있습니다.
메타(Meta)의 글로벌 담당 사장인 닉 클레그(Nick Clegg)는 Llama 3의 새로운 80억 개의 매개변수 모델은 GPT-4와 유사하다고 말했습니다. 마이크로소프트는 70억 개의 매개변수를 가진 자사의 소규모 Phi-3 모델이 OpenAI 모델의 이전 버전인 GPT-3.5보다 성능이 뛰어나다고 밝혔습니다.
마이크로칩은 정보를 클라우드로 전송하는 대신 장치에서 로컬로 작업을 처리할 수도 있는데, 이는 정보가 네트워크 내에만 머물기를 원하는 개인 정보 보호에 민감한 고객에게 매력적일 수 있습니다.
애들쇼 고다드 로펌의 파트너인 샬럿 마셜은 생성 AI 제품을 도입할 때 "많은 고객들이 직면했던 과제 중 하나는" 데이터 처리 및 전송과 관련된 규제 요건을 준수하는 것이라고 말했습니다. 그녀는 소규모 모델이 기업들이 규제 및 비용 문제를 "극복할 수 있는 기회"를 제공한다고 말했습니다.
소형 모델에서는 휴대폰과 같은 기기에서도 AI 기능을 실행할 수 있습니다. 구글의 "제미니 나노" 모델은 최신 픽셀 폰과 삼성의 최신 S24 스마트폰에 내장되어 있습니다.
애플은 자사의 베스트셀러 아이폰에 탑재될 AI 모델을 개발 중이라고 밝혔습니다. 지난달, 실리콘 밸리의 거대 기업 애플은 텍스트 기반 작업을 수행하도록 설계된 소형 모델인 OpenELM을 출시했습니다.
마이크로소프트의 보이드는 작은 모델이 "휴대폰과 노트북에 이르기까지 흥미로운 응용 분야로 이어질 것"이라고 말했습니다.
OpenAI의 샘 알트만 이사는 지난 11월, 다양한 규모의 AI 모델을 "다양한 목적"에 맞춰 고객에게 제공해 왔다고 밝혔습니다. 그는 "소형 모델이 정말 잘 해낼 수 있는 부분들이 있습니다. 정말 기대됩니다."라고 말했습니다.
하지만 알트만은 OpenAI가 추론, 계획, 작업 실행 능력을 포함해 확장성을 갖춘 대규모 AI 모델을 구축하는 데 계속 집중할 것이며 궁극적으로 인간 수준의 지능을 달성하는 데 주력할 것이라고 덧붙였습니다.
황하이 (FT에 따르면)
[광고_2]
출처: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html
댓글 (0)