Ο παίκτης Nakamura είπε ότι ο Grok 4 φάνηκε να παίζει με τεταμένη νοοτροπία στον τελικό αγώνα - Φωτογραφία: στιγμιότυπο οθόνης
Πριν από τον αγώνα, η OpenAI προκάλεσε σάλο όταν ανακοίνωσε την κυκλοφορία του LLM 11ης γενιάς, GPT-5.
Ωστόσο, το μοντέλο o3 - ChatGPT που χρησιμοποιήθηκε στον τελικό έδειξε ισχυρή ικανότητα συλλογισμού, με μέσο ποσοστό σωστών κινήσεων έως και 90,8%, ξεπερνώντας πλήρως το 80,2% του Grok 4.
Και στα τέσσερα παιχνίδια, το ChatGPT δεν έδωσε καμία ευκαιρία στον Grok 4, κάνοντας ματ στον αντίπαλό του μετά από 35, 30, 28 και 54 κινήσεις αντίστοιχα.
Σύμφωνα με τον Νο. 2 στον κόσμο , Hikaru Nakamura, το Grok 4 φάνηκε να παίζει με μεγαλύτερη ένταση και να κάνει περισσότερα λάθη από ό,τι σε προηγούμενους γύρους. Συγκεκριμένα, έχανε εύκολα κομμάτια - κάτι σπάνιο όταν νίκησε συντριπτικά τα Gemini 2.5 Flash και Gemini 2.5 Pro της Google.
Με τρεις συνεχόμενες νίκες με σκορ 4-0 και μέσο ποσοστό ευστοχίας έως και 91%, η o3 ολοκλήρωσε άψογα το τουρνουά.
Αν και η δύναμη του o3 δεν μπορεί να συγκριθεί με αυτή των επαγγελματιών γκρανμαίτρ στο σκάκι, είναι αρκετή για να προκαλέσει δυσκολίες σε παίκτες με Elo κάτω από 2.000. Ειδικά στις κατηγορίες blitz και super blitz.
Το τουρνουά που διοργάνωσε η Google ολοκληρώθηκε με την απόλυτη κυριαρχία των Αμερικανών εκπροσώπων. Ενώ τα δύο κινεζικά μοντέλα, Kimi K4 και DeepSeek, αποκλείστηκαν νωρίς, στον αγώνα για την τρίτη θέση νικήθηκε το Gemini 2.5 Pro επί του o4-mini, επιβεβαιώνοντας τη θέση των κορυφαίων αμερικανικών εταιρειών τεχνολογίας.
Αυτή η εκδήλωση δεν δείχνει μόνο τις εκπληκτικές δυνατότητες των μοντέλων τεχνητής νοημοσύνης γενικής χρήσης σε έναν εξειδικευμένο τομέα, αλλά ανοίγει επίσης μια νέα προοπτική για την πιθανή ανάπτυξη της τεχνητής νοημοσύνης στο μέλλον.
Ωστόσο, αποτελεί επίσης μια υπενθύμιση ότι, ενώ τα LLM (Πτυχία Νομικής) αναπτύσσονται ραγδαία, εξακολουθούν να μην μπορούν να φτάσουν το επίπεδο των επαγγελματικών μηχανών σκακιού, των οποίων οι βαθμολογίες Elo υπερβαίνουν κατά πολύ αυτές των ανθρώπων.
Πηγή: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Σχόλιο (0)