Ο AI Kimi K2 από την Κίνα αποκλείστηκε επειδή έκανε επανειλημμένες παράνομες κινήσεις - Φωτογραφία: chess.com
Με απόλυτη νίκη με 4-0, οι Gemini 2.5 Pro, o4-mini, Grok 4 και o3 προκρίθηκαν με εξαιρετικό τρόπο στα ημιτελικά του τουρνουά σκακιού AI, αφού νίκησαν τους Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash και Kimi k2 αντίστοιχα.
Στον πιο αξιοσημείωτο προημιτελικό, το μοντέλο Kimi K2 της Moonshot AI (Κίνα) υπέστη μια καταστροφική ήττα με 0-4 από την o3, LLM της OpenAI - της εταιρείας ανάπτυξης του ChatGPT.
Και τα τέσσερα παιχνίδια τελείωσαν γρήγορα σε λιγότερες από οκτώ κινήσεις, καθώς ο Kimi K2 έκανε επανειλημμένα αντικανονικές κινήσεις.
Για παράδειγμα, στο τρίτο παιχνίδι, παρά το γεγονός ότι κατάλαβε σωστά τη θέση όταν ο o3 έκανε check back, ο Kimi K2 δεν μπόρεσε να βρει νόμιμη κίνηση και στις τέσσερις προσπάθειες και αναγκάστηκε να παραδεχτεί την ήττα. Το ποσοστό των κινήσεων που ταίριαζαν με το εργαλείο Stockfish του o3 έφτασε το 100%, δείχνοντας ότι η διαφορά στο επίπεδο δεξιοτήτων ήταν πολύ μεγάλη.
Η άλλη κινεζική ομάδα, η DeepSeek, δεν τα πήγε πολύ καλύτερα, χάνοντας με 0-4 από την o4-mini της OpenAI. Παρόλο που τα πήγαν καλύτερα από τους συμπατριώτες τους, άντεξαν στο πρώτο παιχνίδι, η DeepSeek έκανε λάθη και έγινε ματ στα επόμενα παιχνίδια.
Ωστόσο, ο πιο εντυπωσιακός χαρακτήρας στους προημιτελικούς ήταν ο Grok 4, ένα μοντέλο από την xAI Company του δισεκατομμυριούχου Elon Musk. Ο Grok 4 νίκησε εύκολα τον Gemini 2.5 Flash της Google με σκορ 4-0. Με την ικανότητα να τιμωρεί κάθε λάθος του αντιπάλου, το ποσοστό ακρίβειας κινήσεων του Grok 4 έφτασε στο υψηλότερο επίπεδο του γύρου, περίπου στο 97,5%.
Σχολιάζοντας τον αγώνα, ο Νο. 2 στον κόσμο παίκτης Hikaru Nakamura εξεπλάγη: «Το Grok 4 είναι σίγουρα το ισχυρότερο LLM σε αυτό το τουρνουά. Η διαφορά επιπέδου μεταξύ αυτού και των άλλων μοντέλων δεν είναι μικρή».
Αυτό το σχόλιο ενισχύθηκε όταν ο κ. Musk αναδημοσίευσε γρήγορα την εικόνα του σχολίου του Nakamura στο κοινωνικό δίκτυο X, μαζί με το γεμάτο αυτοπεποίθηση σχόλιο: «Αυτό είναι απλώς μια παρενέργεια. Το xAI δεν αφιερώνει σχεδόν καθόλου χρόνο στο σκάκι».
Ο σκακιστής Nakamura είπε ότι το Grok 4 ήταν εντελώς «εκτός παιχνιδιού» στο τουρνουά AI - Φωτογραφία: στιγμιότυπο οθόνης
Από την πλευρά της Google, αν και η Gemini 2.5 Flash αποκλείστηκε, η εναπομείνασα εκπρόσωπός της, η Gemini 2.5 Pro, είχε μια πειστική νίκη με 4-0 επί της Claude 4 Opus της Anthropic Company, επιβεβαιώνοντας τη θέση της στο τουρνουά.
Οι ημιτελικοί θα διεξαχθούν στις 00:30 στις 7 Αυγούστου (ώρα Βιετνάμ). Ο πρώτος ημιτελικός είναι μια αναμέτρηση υψηλού επιπέδου μεταξύ των Grok 4 και Gemini 2.5 Pro. Ο εναπομείνας αγώνας είναι ένα δραματικό "ντέρμπι OpenAI" μεταξύ των o3 και o4-mini.
ΤΟΥΑΝ ΛΟΝΓΚ
Πηγή: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Σχόλιο (0)