Lors de l'événement Journée de l'intelligence artificielle 2023 sur le thème « IA - repenser la réalité » qui se déroulera les 5 et 6 décembre, VinAI Artificial Intelligence Research and Application Company ( Vingroup Corporation) a annoncé un projet de recherche open source sur un grand modèle linguistique pour le vietnamien, PhoGPT.
PhoGPT est un projet open source, contrairement à ChatGPT d'OpenAI, un logiciel propriétaire. Comme il est open source, il n'y a aucune restriction commerciale ; chacun peut utiliser PhoGPT pour développer ses propres applications, y compris des unités d'application à des fins commerciales. Il s'agit donc d'une plateforme destinée à la communauté nationale qui développe des applications liées à l'IA.
Selon le Dr Bui Hai Hung, directeur général de VinAI, société de recherche et d'application en intelligence artificielle, les limites des modèles vietnamiens ont démontré qu'ils n'atteignent pas des performances optimales et qu'ils manquent de code source ouvert. Par conséquent, l'une des tâches urgentes de la communauté de l'IA en général, et de la communauté du traitement du langage naturel (TALN) en particulier, est de développer un nouveau modèle plus puissant, capable de traiter le vietnamien avec une précision et des performances élevées.
Les experts en IA affirment qu'avec un modèle de langage Big Data avec 7,5 milliards de paramètres, construit sur la plateforme de décodage Transformer, ce modèle est formé à partir de zéro, en utilisant les techniques les plus avancées disponibles telles que le mécanisme Flash Attention, l'extrapolation de la longueur du contexte AliBi...
Ces techniques permettent non seulement au modèle d'acquérir une meilleure compréhension du contexte, mais aussi d'améliorer les capacités naturelles de dialogue et d'interaction de PhoGPT. Cela fait du modèle un outil polyvalent et multitâche, capable de répondre aux besoins linguistiques d'un large éventail d'utilisateurs.
Le Dr Bui Hai Hung a ajouté que PhoGPT a été développé par l'entreprise dès le départ, indépendamment de tous les autres modèles mondiaux . Grâce à son modèle open source, la communauté vietnamienne peut mieux l'utiliser et l'améliorer. Rendre le code source de PhoGPT public et accessible aux utilisateurs contribue à créer un environnement propice au développement d'applications personnalisées et uniques.
L'un des objectifs de l'open source est de poser les bases pour que les utilisateurs n'aient plus à refaire de code et que les unités puissent développer davantage de modèles linguistiques à grande échelle, comme PhoGPT. Cela contribuera à créer une communauté open source de qualité pour les modèles linguistiques vietnamiens à grande échelle, favorisant ainsi la participation et l'application de nombreuses entreprises dans un domaine donné. Avec PhoGPT, VinAI, société de recherche et d'application en intelligence artificielle, a annoncé son intention de développer des applications pour les utilisateurs individuels et un ensemble de solutions d'assistance spécialisées pour les entreprises vietnamiennes dans des secteurs tels que la santé, l'éducation, etc.
PhoGPT a posé les premières bases du développement de modèles de langue vietnamienne hautes performances, comme base pour le développement d'applications pratiques et efficaces, conformément à la stratégie de développement de l'IA du gouvernement jusqu'en 2030.
BA TAN
Source
Comment (0)