Σύμφωνα με την ανακοίνωση της Tencent στον επίσημο λογαριασμό της στο WeChat, το αναβαθμισμένο μοντέλο T1 προσφέρει ταχύτερες ταχύτητες απόκρισης και ανώτερο χειρισμό εγγράφων μεγάλου κειμένου.
Η Tencent παρουσίασε το μοντέλο συμπερασμού T1, το οποίο ξεπερνά το DeepSeek σε αρκετές μετρήσεις γνώσης και ικανότητας συλλογισμού.
Η ανάρτηση ανέφερε ότι το T1 μπορεί να «διατηρεί τη λογική του περιεχομένου σαφή και το κείμενο καθαρό και τακτοποιημένο» και ότι το ποσοστό «παραισθήσεων» — ένα φαινόμενο όπου η τεχνητή νοημοσύνη παράγει λανθασμένες πληροφορίες — είναι «εξαιρετικά χαμηλό».
Η κυκλοφορία έρχεται εν μέσω έντονου ανταγωνισμού στην αγορά τεχνητής νοημοσύνης της Κίνας, ειδικά μετά την κυκλοφορία μοντέλων με απόδοση συγκρίσιμη ή ανώτερη από τα δυτικά συστήματα από την DeepSeek, με σημαντικά χαμηλότερο κόστος.
Η Tencent κυκλοφόρησε προηγουμένως μια beta έκδοση του T1 σε όλες τις πλατφόρμες, συμπεριλαμβανομένης της εφαρμογής βοηθού τεχνητής νοημοσύνης Yuanbao.
Η επίσημη έκδοση θα βασίζεται στο μοντέλο γλώσσας πλατφόρμας Turbo S της Tencent, το οποίο ανακοινώθηκε στα τέλη του περασμένου μήνα. Η εταιρεία ισχυρίζεται ότι το Turbo S επεξεργάζεται τα ερωτήματα πιο γρήγορα από το μοντέλο R1 του ανταγωνιστή DeepSeek.
Ένα διάγραμμα που δημοσιεύτηκε στην ανάρτηση και συγκρίνει το μοντέλο T1 με το DeepSeek R1 δείχνει ότι το προϊόν της Tencent υπερέχει σε διάφορες μετρήσεις γνώσης και ικανότητας συλλογισμού.
Η Tencent έχει αυξήσει τις επενδύσεις της στην Τεχνητή Νοημοσύνη τους τελευταίους μήνες. Την Πέμπτη, η εταιρεία ανακοίνωσε σχέδια για αύξηση των κεφαλαιουχικών δαπανών το 2025, μετά από μεγάλες δαπάνες στην Τεχνητή Νοημοσύνη έως το 2024.
Το T1 έχει σημειώσει υψηλές βαθμολογίες σε πολλά σημαντικά σημεία αναφοράς τεχνητής νοημοσύνης, κατατάσσοντάς το ανάμεσα στα κορυφαία μοντέλα παγκοσμίως .
Πρόσφατες αξιολογήσεις δείχνουν ότι το T1 σημείωσε βαθμολογία 87,2 στο MMLU-Pro, ένα σύνολο δεδομένων που μετρά τη βασική συλλογιστική σε μεγάλα γλωσσικά μοντέλα. Αυτή η βαθμολογία είναι δεύτερη μόνο στο OpenAI o1.
Επιπλέον, το T1 είχε καλή απόδοση σε δημόσια κριτήρια αξιολόγησης όπως τα CEval, AIME και Zebra Logic, τα οποία μετρούν τις γενικές γνώσεις και τη συλλογιστική τόσο στα κινέζικα όσο και στα αγγλικά.
Πηγή: https://www.baogiaothong.vn/tencent-trinh-lang-mo-hinh-suy-luan-t1-vuot-troi-so-voi-deepseek-192250322131611869.htm
Σχόλιο (0)