VinBigdata a annoncé le 21 août la construction réussie d'un grand modèle de langue vietnamienne, créant ainsi une base pour la maîtrise de la technologie de l'IA générative.
Les grands modèles linguistiques (LLM) sont des modèles entraînés à l'aide de techniques d'apprentissage profond sur d'importants ensembles de données textuelles ou visuelles. Ces modèles sont capables de comprendre des connaissances, de générer du texte et d'effectuer diverses tâches de traitement du langage naturel. Ils sont considérés comme la clé du développement de l'IA générative, capable de générer de nouveaux contenus et idées sous de nombreuses formes (texte, images, audio, etc.).
Avec la construction réussie d'un grand modèle de langue vietnamienne, VinBigdata intégrera la technologie pour faire de VinBase (une plate-forme complète d'intelligence artificielle multicognitive) une plate-forme d'IA générative au Vietnam, tout en fournissant des solutions de développement basées sur cette technologie telles que le chatbot d'IA générative, le callbot ou l'assistant virtuel ViVi de nouvelle génération... Cette technologie contribue à augmenter le caractère naturel de la communication avec les machines, tout en aidant les utilisateurs à rechercher et à synthétiser des informations plus rapidement et plus simplement qu'auparavant.
Professeur Vu Ha Van – Directeur scientifique de VinBigdata. Photo : VinBigdata
Le professeur Vu Ha Van, directeur scientifique de VinBigdata Company, a déclaré que de nombreuses grandes entreprises internationales ont développé et lancé avec succès des produits basés sur de grands modèles linguistiques, comme OpenAI avec ChatGPT ou Google avec Bard. Au Vietnam, VinBigdata bénéficie d'un investissement de Vingroup pour développer un grand modèle linguistique vietnamien. Selon M. Van, ce modèle vise à résoudre trois problèmes fondamentaux : améliorer la précision, réduire les coûts d'infrastructure et garantir la sécurité.
« Au lieu d'avoir besoin d'environ 175 milliards de paramètres comme ChatGPT, VinBigdata peut créer un grand modèle de langage avec plusieurs milliards de paramètres mais a toujours la capacité de générer des documents hautement authentiques, en se concentrant sur les données vietnamiennes et les connaissances vietnamiennes », a déclaré le chef de l'unité.
La maîtrise de la technologie, l'auto-développement dès les premières étapes et la construction d'un vaste modèle linguistique vietnamien sont des avancées majeures pour VinBigdata, qui a permis d'intégrer l'IA générative à son écosystème de produits et services. L'entreprise a d'abord appliqué cette nouvelle technologie à la gamme de produits VinBase KB (portail de base de connaissances VinBase). Ce produit permet de récupérer des informations et de générer automatiquement des réponses à partir d'ensembles de données extrêmement volumineux du système de connaissances.
Un représentant de VinBigdata a présenté l'IA générative lors de l'événement. Photo : VinBigdata
Les membres de Vingroup devraient lancer deux gammes de produits principales en décembre prochain : VinBase2.0 et l'application ViGPT. VinBase 2.0 est une plateforme d'IA qui crée des perceptions multiples grâce à des solutions destinées aux entreprises et aux agences gouvernementales . L'application ViGPT, quant à elle, est présentée par l'entreprise comme la « version vietnamienne de ChatGPT », accessible et testable par la communauté. Avec ViGPT, les utilisateurs peuvent poser des questions et répondre à des questions sur des informations spécifiques au Vietnam (réglementations, documents juridiques) ou locales (histoire, littérature, sites touristiques, spécialités locales).
La société par actions VinBigdata dispose d'un système de base de données pouvant atteindre 3 500 téraoctets. Ce système contient des centaines de milliers d'heures de données vocales, d'images et d'informations, nettoyées, traitées, classifiées et utilisées pour la formation en IA, ainsi que pour son infrastructure de R&D. Cette infrastructure comprend des dizaines de clusters de serveurs NvidiaDGX A100. L'entreprise dispose également d'une équipe de professeurs, de scientifiques et d'experts technologiques vietnamiens du monde entier.
Hoai Phuong
Lien source
Comment (0)