Produsul a creat rapid vâlvă în comunitatea științifică și tehnologică vietnameză.
Alege calea dificilă pentru a rezolva problemele vietnameze
La sfârșitul anului 2022, ChatGPT a creat un „big bang”, deschizând o cursă pentru cucerirea inteligenței artificiale printre țări și giganți din domeniul tehnologiei. La acea vreme, comunitatea tehnologică vietnameză era, de asemenea, dornică să dezvolte produse vietnameze pentru a fi autosuficiente din punct de vedere tehnologic, reducând dependența de produsele internaționale. Cu toate acestea, nu fiecare unitate are capacitatea și determinarea de a realiza această dorință, așa cum VinBigdata.
„IA generativă este o problemă dificilă. Companiile mari precum OpenAI sau Google trebuie, de asemenea, să investească multe resurse și timp în cercetare pentru a putea crea produse precum cele pe care le vedem noi. Aceste produse sunt foarte bune, dar, de fapt, oamenii de știință încă nu înțeleg pe deplin mecanismul său de funcționare. Puțini pot prezice când are erori și care vor fi acestea. Dezvoltarea unui produs similar cu ChatGPT pentru vietnamezi, într-un timp scurt, mai puțin de un an, prezintă multe provocări. Dar am ales să „riscăm”, deoarece dacă o versiune vietnameză a ChatGPT nu este realizată de vietnamezi, atunci cine o va realiza?” - a declarat profesorul Vu Ha Van - director științific la VinBigdata.
De fapt, foarte puține companii aleg să își construiască propriile Modele de Limbaj Mari de la zero. De exemplu, GPT 3 de la OpenAI are 175 de miliarde de parametri și a fost antrenat pe un set de date de 45 de terabytes și a costat 4,6 milioane de dolari. Conform calculelor, costul dezvoltării GPT 4 ar putea ajunge chiar și la 100 de milioane de dolari. „Cu cifre atât de mari, este foarte dificil să găsești o companie care își poate permite să investească în această tehnologie”, a declarat Dr. Nguyen Kim Anh - Director de Produs la VinBigdata.
Pentru ca firmele vietnameze să acceseze tehnologia IA de nouă generație, cu costuri și infrastructură optime, VinBigdata a ales o direcție complet diferită, și anume crearea unui model lingvistic cu doar 1,6 miliarde de parametri, dar cu capabilități echivalente cu modele lingvistice mari, cu miliarde de parametri. „Rezultatele arată că, prin arhitectura dezvoltată chiar de VinBigdata, este complet posibil să se optimizeze și să se accelereze procesul de instruire a modelului lingvistic, să se reducă costurile de infrastructură (inclusiv costurile de instruire și costurile de utilizare), dar să se asigure în continuare calitatea modelului”, a adăugat Dr. Nguyen Kim Anh.
După rezolvarea problemei dimensiunilor mari ale modelului lingvistic, în timpul procesului de „concepere” a ViGPT, după studierea modelelor străine, echipa VinBigdata a realizat și o altă provocare: „iluzia”, provenită din natura inerentă a modelelor statistice de probabilitate.
Prin urmare, cele mai mari modele lingvistice din lume sunt adesea antrenate cu surse de date în limba engleză. Prin urmare, acest model nu înțelege cu adevărat și nu răspunde corect la contextul și cultura vietnamezilor. Acest lucru duce la o halucinație care determină modelul lingvistic extins să „fabrice” răspunsuri incorecte.
Pentru a găsi soluția optimă în cel mai scurt timp, echipa de Prelucrare a Limbajului Natural (NLP) de la VinBigdata a fost împărțită în grupuri mici, analizând și discutând diferite idei pentru a găsi cea mai potrivită direcție finală.
„În cele din urmă, am decis să dezvoltăm o arhitectură diferită de majoritatea modelelor lingvistice mari actuale și să efectuăm instruire pe un set de date vietnameze fin ajustat de 600 GB, pentru a crea un «asistent virtual inteligent» capabil să înțeleagă și să ofere răspunsuri în funcție de contextul poporului vietnamez”, a adăugat Dr. Nguyen Kim Anh.
Aspirația pentru un ecosistem tehnologic vietnamez
Conform rezultatelor evaluării Standardelor de Evaluare a Competenței în Limba Vietnameză (VMLU), ViGPT a obținut un scor mediu de 42,24%, fiind al doilea după ChatGPT (48,54%). Acest rezultat permite ViGPT să caute rapid informații și să răspundă la întrebări despre subiecte specifice și specifice din Vietnam.
Pe lângă capacitățile asistentului virtual, echipa de dezvoltare își dorește să integreze ViGPT în produse familiare, de zi cu zi, pentru a crea schimbări în viața vietnamezilor. Aceasta este forța motrice care motivează echipa VinBigdata să construiască un ecosistem de produse lingvistice și vocale care aplică ViGPT - ecosistemul „Vi” include: ViChat, ViVoice, ViVi Virtual Assistant. Aceste produse pot fi utilizate în numeroase industrii, de la industria auto, bancar - financiar, asigurări până la transporturi și multe alte domenii.
„Când lucrăm cu tehnologia, în special cu inteligența artificială, nu vrem doar să cucerim sisteme interesante, complexe, greu de observat. Vrem să creăm produse tangibile, extrem de aplicabile, în care inteligența artificială este agentul direct care creează schimbări în viață”, a afirmat directorul de produs VinBigdata.
Prin urmare, dezvoltarea cu succes a ViGPT este doar primul pas în călătoria de a aduce tehnologia și datele „pur vietnameze” în serviciul a milioane de vietnamezi. Un reprezentant al VinBigdata a declarat că această unitate își propune să integreze ViGPT în platforma de inteligență artificială multi-cognitivă VinBase 2.0, pentru a oferi soluții superioare pentru organizații și companii de diferite dimensiuni și industrii.
Înainte de ViGPT, echipa de experți și ingineri în domeniul tehnologiei de procesare a limbajului și a vorbirii, VinBigdata, și-a pus amprenta prin lansarea ViVi - primul asistent virtual vietnamez complet (aplicat și implementat pe mașinile electrice VinFast , aplicațiile Vinhomes Resident și platforma de comerț electronic Vinhomes Online), stăpânind în același timp complet cele mai avansate tehnologii din lume, cum ar fi Biometria Vocală sau Clonarea Vocală.
Toate aceste tehnologii sunt dezvoltate pe baza unei baze de date de 3.500 terabytes, concentrându-se în principal pe date specifice Vietnamului, colectate, analizate și rafinate de VinBigdata. Scopul final este de a aduce tehnologia mondială în viața vietnameză, utilizând sistemele de date și cunoștințe vietnameze.
ViGPT este prima „versiune vietnameză a ChatGPT” pentru utilizatorii finali, construită pe modelul lingvistic vietnamez (LLM) dezvoltat de VinBigdata. ViGPT posedă caracteristici remarcabile și este conceput pentru a se potrivi cel mai bine nevoilor vietnamezilor, cum ar fi crearea de conținut, căutarea de informații și răspunsul la întrebări frecvente tipice Vietnamului. Înregistrați-vă și experimentați ViGPT la: vigpt.vinbigdata.com |
Thanh Ha
Sursă
Comentariu (0)