Το προϊόν δημιούργησε γρήγορα αίσθηση στην επιστημονική και τεχνολογική κοινότητα του Βιετνάμ.

Επιλέξτε το δύσκολο μονοπάτι για να λύσετε τα προβλήματα του Βιετνάμ

Στα τέλη του 2022, το ChatGPT δημιούργησε μια «μεγάλη έκρηξη», ανοίγοντας έναν αγώνα δρόμου για την κατάκτηση της τεχνητής τεχνητής νοημοσύνης μεταξύ χωρών και γιγάντων στον τομέα της τεχνολογίας. Εκείνη την εποχή, η βιετναμέζικη τεχνολογική κοινότητα ήταν επίσης πρόθυμη να αναπτύξει βιετναμέζικα προϊόντα που θα είναι αυτάρκη στην τεχνολογία, μειώνοντας την εξάρτηση από τα διεθνή προϊόντα. Ωστόσο, δεν έχουν όλες οι μονάδες την ικανότητα και την αποφασιστικότητα να πραγματοποιήσουν αυτή την επιθυμία όπως η VinBigdata.

«Η γενετική τεχνητή νοημοσύνη είναι ένα δύσκολο πρόβλημα. Μεγάλες εταιρείες όπως η OpenAI ή η Google πρέπει επίσης να αφιερώσουν πολλούς πόρους και χρόνο στην έρευνα για να μπορέσουν να δημιουργήσουν προϊόντα όπως αυτά που βλέπουμε. Αυτά τα προϊόντα είναι πολύ καλά, αλλά στην πραγματικότητα, οι επιστήμονες εξακολουθούν να μην κατανοούν πλήρως τον μηχανισμό λειτουργίας τους. Πότε παρουσιάζει σφάλματα και ποια θα είναι αυτά, λίγοι μπορούν να προβλέψουν. Για να αναπτύξουμε ένα προϊόν παρόμοιο με το ChatGPT για τους Βιετναμέζους, σε σύντομο χρονικό διάστημα λιγότερο από ένα χρόνο, υπάρχουν πολλές προκλήσεις. Αλλά επιλέξαμε να «ρισκάρουμε» γιατί αν μια βιετναμέζικη έκδοση του ChatGPT δεν κατασκευαστεί από Βιετναμέζους, τότε ποιος θα την φτιάξει;» - μοιράστηκε ο καθηγητής Vu Ha Van - Διευθυντής Επιστημών της VinBigdata.

Στην πραγματικότητα, πολύ λίγες εταιρείες επιλέγουν να κατασκευάσουν τα δικά τους μοντέλα μεγάλων γλωσσών από την αρχή. Για παράδειγμα, το GPT 3 της OpenAI έχει 175 δισεκατομμύρια παραμέτρους και εκπαιδεύτηκε σε ένα σύνολο δεδομένων 45 terabyte και κόστισε 4,6 εκατομμύρια δολάρια. Σύμφωνα με υπολογισμούς, το κόστος ανάπτυξης του GPT 4 θα μπορούσε να φτάσει ακόμη και τα 100 εκατομμύρια δολάρια. «Με τόσο τεράστιους αριθμούς, είναι πολύ δύσκολο να βρεθεί μια εταιρεία που έχει την οικονομική δυνατότητα να επενδύσει σε αυτήν την τεχνολογία», δήλωσε ο Δρ. Nguyen Kim Anh - Διευθυντής Προϊόντος της VinBigdata.

εικόνα 1.jpg

Προκειμένου οι βιετναμέζικες επιχειρήσεις να έχουν πρόσβαση σε τεχνολογία τεχνητής νοημοσύνης νέας γενιάς, με βέλτιστο κόστος και υποδομή, η VinBigdata επέλεξε μια εντελώς διαφορετική κατεύθυνση, η οποία είναι η δημιουργία ενός γλωσσικού μοντέλου με μόνο 1,6 δισεκατομμύρια παραμέτρους, αλλά με δυνατότητες ισοδύναμες με μεγάλα γλωσσικά μοντέλα με δισεκατομμύρια παραμέτρους. «Τα αποτελέσματα δείχνουν ότι με την αρχιτεκτονική που ανέπτυξε η ίδια η VinBigdata, είναι απολύτως εφικτό να βελτιστοποιηθεί και να επιταχυνθεί η διαδικασία εκπαίδευσης του γλωσσικού μοντέλου, να μειωθεί το κόστος υποδομής (συμπεριλαμβανομένου του κόστους εκπαίδευσης και του κόστους χρήσης), αλλά να διασφαλιστεί η ποιότητα του μοντέλου», πρόσθεσε ο Δρ. Nguyen Kim Anh.

Αφού έλυσε το πρόβλημα του μεγάλου μεγέθους γλωσσικού μοντέλου, κατά τη διάρκεια της διαδικασίας «σύλληψης» του ViGPT, μετά τη μελέτη ξένων μοντέλων, η ομάδα VinBigdata συνειδητοποίησε επίσης μια άλλη πρόκληση: την «ψευδαίσθηση», που προέρχεται από την εγγενή φύση των στατιστικών πιθανοτικών μοντέλων.

Συνεπώς, τα μεγαλύτερα γλωσσικά μοντέλα στον κόσμο συχνά εκπαιδεύονται με πηγές δεδομένων αγγλικής γλώσσας. Επομένως, αυτό το μοντέλο δεν κατανοεί πραγματικά και δεν ανταποκρίνεται σωστά στο πλαίσιο και τον πολιτισμό του Βιετναμέζικου λαού. Αυτό οδηγεί σε μια παραίσθηση που αναγκάζει το μεγάλο γλωσσικό μοντέλο να «κατασκευάσει» λανθασμένες απαντήσεις.

εικόνα 3.jpg

Για να βρεθεί η βέλτιστη λύση στον συντομότερο δυνατό χρόνο, η ομάδα Επεξεργασίας Φυσικής Γλώσσας (NLP) της VinBigdata χωρίστηκε σε μικρές ομάδες, οι οποίες ανέλυσαν και συζήτησαν διαφορετικές ιδέες για να βρουν την καταλληλότερη τελική κατεύθυνση.

«Τέλος, αποφασίσαμε να αναπτύξουμε μια διαφορετική αρχιτεκτονική από τα περισσότερα τρέχοντα μεγάλα γλωσσικά μοντέλα και να διεξάγουμε εκπαίδευση σε ένα βελτιστοποιημένο σύνολο δεδομένων βιετναμέζικων 600GB, για να δημιουργήσουμε έναν «έξυπνο εικονικό βοηθό» ικανό να κατανοεί και να δίνει απαντήσεις ανάλογα με το περιβάλλον του Βιετναμέζικου λαού», πρόσθεσε ο Δρ. Nguyen Kim Anh.

Φιλοδοξία για ένα βιετναμέζικο τεχνολογικό οικοσύστημα

Σύμφωνα με τα αποτελέσματα αξιολόγησης από τα Πρότυπα Αξιολόγησης Επάρκειας Γλώσσας Βιετναμέζικα (VMLU), το ViGPT πέτυχε μέση βαθμολογία 42,24%, δεύτερη μόνο μετά το ChatGPT (48,54%). Αυτό το αποτέλεσμα επιτρέπει στο ViGPT να αναζητά γρήγορα πληροφορίες και να απαντά σε ερωτήσεις σχετικά με συγκεκριμένα και εξειδικευμένα θέματα του Βιετνάμ.

Εκτός από τις δυνατότητες του εικονικού βοηθού, αυτό που θέλει η ομάδα ανάπτυξης είναι να ενσωματώσει το ViGPT σε οικεία, καθημερινά προϊόντα, προκειμένου να δημιουργήσει αλλαγές στη ζωή των Βιετναμέζων. Αυτή είναι η κινητήρια δύναμη που παρακινεί την ομάδα VinBigdata να δημιουργήσει ένα οικοσύστημα γλωσσικών και φωνητικών προϊόντων που εφαρμόζουν το ViGPT - το οικοσύστημα "Vi" περιλαμβάνει: ViChat, ViVoice, ViVi Virtual Assistant. Αυτά τα προϊόντα μπορούν να χρησιμοποιηθούν σε πολλούς κλάδους, από την αυτοκινητοβιομηχανία, τις τραπεζικές - χρηματοοικονομικές, τις ασφάλειες έως τις μεταφορές και πολλούς άλλους τομείς.

«Όταν εργαζόμαστε με την τεχνολογία, ειδικά με την Τεχνητή Νοημοσύνη, δεν θέλουμε απλώς να κατακτήσουμε ενδιαφέροντα, πολύπλοκα συστήματα που είναι δύσκολο να τα δούμε. Θέλουμε να δημιουργήσουμε απτά, άκρως εφαρμόσιμα προϊόντα, όπου η Τεχνητή Νοημοσύνη είναι ο άμεσος παράγοντας που δημιουργεί αλλαγές στη ζωή», επιβεβαίωσε ο Διευθυντής Προϊόντος της VinBigdata.

εικόνα 4.jpg

Επομένως, η επιτυχημένη ανάπτυξη του ViGPT είναι μόνο το πρώτο βήμα στο ταξίδι για να φέρει την «καθαρά βιετναμέζικη» τεχνολογία και δεδομένα στην υπηρεσία εκατομμυρίων Βιετναμέζικων. Ένας εκπρόσωπος της VinBigdata δήλωσε ότι αυτή η μονάδα στοχεύει στην ενσωμάτωση του ViGPT στην πολυγνωστική πλατφόρμα τεχνητής νοημοσύνης VinBase 2.0, προκειμένου να παρέχει ανώτερες λύσεις σε οργανισμούς και επιχειρήσεις διαφόρων μεγεθών και κλάδων.

Πριν από το ViGPT, η ομάδα εμπειρογνωμόνων και μηχανικών στον τομέα της τεχνολογίας επεξεργασίας γλώσσας και ομιλίας VinBigdata άφησε το στίγμα της λανσάροντας το ViVi - τον πρώτο ολοκληρωμένο βιετναμέζικο εικονικό βοηθό (εφαρμοσμένο και ανεπτυγμένο σε ηλεκτρικά αυτοκίνητα VinFast , εφαρμογές Vinhomes Resident και πλατφόρμα ηλεκτρονικού εμπορίου Vinhomes Online), κατακτώντας παράλληλα πλήρως τις πιο προηγμένες τεχνολογίες στον κόσμο, όπως η Βιομετρία Φωνής ή η Κλωνοποίηση Φωνής.

Όλες αυτές οι τεχνολογίες αναπτύσσονται με βάση μια βάση δεδομένων 3.500 terabyte, εστιάζοντας κυρίως σε δεδομένα ειδικά για το Βιετνάμ, τα οποία συλλέγονται, αναλύονται και βελτιώνονται από την VinBigdata. Ο απώτερος στόχος είναι να φέρει την παγκόσμια τεχνολογία στη βιετναμέζικη ζωή, χρησιμοποιώντας βιετναμέζικα συστήματα δεδομένων και γνώσης.

Το ViGPT είναι η πρώτη «βιετναμέζικη έκδοση του ChatGPT» για τελικούς χρήστες, βασισμένη στο βιετναμέζικο μοντέλο μεγάλης γλώσσας (LLM) που αναπτύχθηκε από την VinBigdata. Το ViGPT διαθέτει εξαιρετικά χαρακτηριστικά και έχει σχεδιαστεί για να ταιριάζει καλύτερα στις ανάγκες των Βιετναμέζων, όπως η δημιουργία περιεχομένου, η αναζήτηση πληροφοριών και η απάντηση σε συνήθεις ερωτήσεις που είναι τυπικές για το Βιετνάμ. Εγγραφείτε και ζήστε την εμπειρία του ViGPT στη διεύθυνση: vigpt.vinbigdata.com

Ταν Χα