Nakamura játékos azt mondta, hogy a Grok 4 feszült mentalitással játszott a döntőben - Fotó: képernyőkép
A mérkőzés előtt az OpenAI nagy port kavart, amikor bejelentette 11. generációs LLM-jének, a GPT-5-nek a megjelenését.
A döntőben használt o3 - ChatGPT modell azonban továbbra is erős érvelési képességet mutatott, átlagosan akár 90,8%-os helyes lépésaránnyal, amivel teljesen felülmúlta a Grok 4 80,2%-át.
A ChatGPT mind a négy játszmában esélyt sem adott Grok 4-nek, 35, 30, 28 és 54 lépés után sakk-mattot adott ellenfelének.
A világranglista második helyezettje, Hikaru Nakamura szerint a Grok 4 láthatóan nagyobb feszültséggel játszott és több hibát vétett, mint az előző fordulókban. Különösen könnyen vesztettek bábukat – ez ritka eset volt, amikor elsöprő fölénnyel győzték le a Google Gemini 2.5 Flash és Gemini 2.5 Pro kártyáit.
Három egymást követő győzelemmel, 4-0-s eredménnyel és akár 91%-os átlagos pontossággal az o3 tökéletesen zárta a tornát.
Bár az o3 ereje nem hasonlítható össze a profi sakk nagymesterekével, mégis elég ahhoz, hogy nehézségeket okozzon a 2000 alatti ELO-jú játékosoknak. Különösen a villámhárítás és a szuper villámhárítás kategóriákban.
A Google által szervezett torna az amerikai képviselők abszolút dominanciájával ért véget. Míg a két kínai modell, a Kimi K4 és a DeepSeek is korán kiesett, a harmadik helyért folyó küzdelemben a Gemini 2.5 Pro győzött az o4-mini felett, megerősítve a vezető amerikai technológiai vállalatok pozícióját.
Ez az esemény nemcsak az általános célú MI-modellek lenyűgöző képességeit mutatja be egy speciális területen, hanem új perspektívát is nyit a mesterséges intelligencia jövőbeli fejlődési lehetőségeire.
Ugyanakkor arra is emlékeztetőül szolgál, hogy bár az LLM-ek gyorsan fejlődnek, még mindig nem érik el a professzionális sakkmotorok szintjét, amelyek Elo-értékelése messze meghaladja az emberekét.
Forrás: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Hozzászólás (0)