AI Kimi K2 din China a fost descalificată pentru efectuarea repetată a unor mutări ilegale - Foto: chess.com
Cu o victorie absolută cu 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 și o3 au avansat excelent în semifinalele turneului de șah AI, după ce i-au învins pe Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash și, respectiv, Kimi k2.
În cel mai notabil sfert de finală, modelul Kimi K2 (China) de la Moonshot AI a suferit o înfrângere dezastruoasă cu 0-4 împotriva lui o3, LLM de la OpenAI - dezvoltatorul ChatGPT.
Toate cele patru jocuri s-au încheiat rapid în mai puțin de opt mutări, deoarece Kimi K2 a făcut în mod repetat mutări ilegale.
De exemplu, în al treilea joc, deși a înțeles corect poziția când o3 a dat un checkback, Kimi K2 tot nu a putut găsi o mutare legală în toate cele patru încercări și a fost nevoită să recunoască înfrângerea. Procentul de mutări care s-au potrivit cu instrumentul Stockfish al lui o3 a ajuns la 100%, ceea ce arată că diferența de nivel de îndemânare era prea mare.
Cealaltă reprezentativă chineză, DeepSeek, nu a avut o descurcare mult mai bună, pierzând cu 0-4 în fața echipei o4-mini de la OpenAI. Deși s-au descurcat mai bine decât compatrioții lor, rezistând în primul joc, DeepSeek a făcut totuși greșeli și a fost dată șah-mat în jocurile următoare.
Cu toate acestea, cel mai impresionant personaj din sferturile de finală a fost Grok 4, un model de la compania xAI a miliardarului Elon Musk. Grok 4 l-a învins cu ușurință pe Gemini 2.5 Flash de la Google cu scorul de 4-0. Având capacitatea de a pedepsi fiecare greșeală a adversarului, rata de precizie a mișcărilor lui Grok 4 a atins cel mai înalt nivel al rundei, aproximativ 97,5%.
Comentând meciul, jucătorul numărul 2 mondial , Hikaru Nakamura, a fost surprins: „Grok 4 este cu siguranță cel mai puternic LLM din acest turneu. Diferența de nivel dintre acesta și celelalte modele nu este mică.”
Acest comentariu a fost întărit când dl. Musk a redistribuit rapid imaginea comentariului lui Nakamura pe rețeaua de socializare X, împreună cu comentariul încrezător: „Acesta este doar un efect secundar. xAI nu petrece aproape deloc timp jucând șah”.
Jucătorul de șah Nakamura a declarat că Grok 4 a fost complet „în afara jocului” la turneul AI - Foto: captură de ecran
De partea Google, deși Gemini 2.5 Flash a fost eliminat, reprezentantul lor rămas, Gemini 2.5 Pro, a obținut o victorie convingătoare cu 4-0 în fața lui Claude 4 Opus de la Anthropic Company, afirmându-și poziția în turneu.
Semifinalele vor avea loc pe 7 august (ora Vietnamului) la ora 0:30. Prima semifinală este o confruntare la nivel înalt între Grok 4 și Gemini 2.5 Pro. Meciul rămas este un dramatic „OpenAI derby” între o3 și o4-mini.
TUAN LONG
Sursă: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Comentariu (0)