Oyuncu Nakamura, Grok 4'ün final maçında gergin bir zihniyetle oynadığını söyledi - Fotoğraf: ekran görüntüsü
Maç öncesinde OpenAI, 11. nesil LLM programı GPT-5'in lansmanını duyurarak büyük yankı uyandırdı.
Ancak finalde kullanılan o3 - ChatGPT modeli yine de güçlü bir muhakeme yeteneği gösterdi ve %90,8'e varan ortalama doğru hamle oranıyla Grok 4'ün %80,2'lik oranını tamamen geride bıraktı.
ChatGPT, dört oyunda da Grok 4'e hiç şans tanımadı ve rakibini sırasıyla 35, 30, 28 ve 54 hamlede mat etti.
Dünya 2 numarası Hikaru Nakamura'ya göre, Grok 4 önceki turlara göre daha gergin oynuyor ve daha fazla hata yapıyor gibi görünüyor. Özellikle, Google'ın Gemini 2.5 Flash ve Gemini 2.5 Pro'yu ezici bir şekilde yendiğinde nadir görülen bir durum olan kolayca taş kaybediyor.
Üst üste 4-0'lık skorla aldığı 3 galibiyet ve %91'e varan isabet oranıyla o3 turnuvayı kusursuz bir şekilde tamamladı.
o3'ün gücü profesyonel satranç ustalarıyla kıyaslanamaz olsa da, Elo'su 2.000'in altında olan oyuncular için zorluk yaratacak düzeydedir. Özellikle blitz ve süper blitz kategorilerinde.
Google tarafından düzenlenen turnuva, Amerikalı temsilcilerin mutlak hakimiyetiyle sona erdi. İki Çinli model Kimi K4 ve DeepSeek erken elenirken, üçüncülük maçında Gemini 2.5 Pro, o4-mini'yi yenerek lider Amerikan teknoloji şirketlerinin konumunu pekiştirdi.
Bu etkinlik, yalnızca genel amaçlı yapay zeka modellerinin özel bir alandaki inanılmaz yeteneklerini göstermekle kalmıyor, aynı zamanda yapay zekanın gelecekteki potansiyel gelişimine yeni bir bakış açısı da sunuyor.
Ancak, LLM'lerin hızla gelişmesine rağmen, Elo reytingleri insanlarınkini çok aşan profesyonel satranç motorlarının seviyesine henüz ulaşamadıkları da bir hatırlatmadır.
Kaynak: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Yorum (0)