Le partage ci-dessus a été donné par le professeur Vu Ha Van, directeur scientifique de VinBigdata, lors d'une discussion avec des journalistes en marge du récent événement de lancement de ViGPT.

anhvuhavan.jpg
Professeur Vu Ha Van, directeur scientifique de VinBigdata.

ViGPT a besoin des contributions des techniciens et de la communauté

Le professeur Vu Ha Van a expliqué que les grandes entreprises comme Google, lorsqu'elles développent des langages complexes, choisissent l'anglais ou le français comme langue principale. Bien que le vietnamien soit également présent, les résultats de recherche seront relativement lents par rapport à d'autres langues. Dans une certaine mesure, les réponses de ces grands modèles linguistiques aux questions posées en vietnamien ne seront ni complètes ni précises.

VinBigdata espère donc qu'avec le temps, ViGPT les surpassera en précision sur les questions directement liées à la culture, à l'histoire, à la géographie, etc., informations spécifiques au peuple vietnamien. C'est l'objectif des créateurs du modèle linguistique vietnamien : il constituera une meilleure source de comparaison que les sources étrangères.

Pour aller plus loin, le directeur scientifique de VinBigdata a analysé, par exemple, une question concernant l'histoire de Truong Sa et Hoang Sa, en cette période politiquement sensible. Il est très difficile de garantir que la réponse de Google ou d'OpenAI ne reflète pas les préjugés politiques des fondateurs ou des responsables de ces entreprises. D'autres options s'offrent à nous au Vietnam ; il serait préférable d'y réfléchir.

« Notre objectif en construisant un grand modèle linguistique pour le peuple vietnamien est d'apporter les meilleures réponses au peuple vietnamien, nous ne pouvons pas connaître leur objectif », a partagé le professeur Vu Ha Van.

Il admet que ViGPT ne peut actuellement pas faire beaucoup de choses aussi bien que ChatGPT ou Google Bard, car le taux d'investissement de ces entreprises et le temps consacré à leur mise en œuvre sont des milliers de fois supérieurs. Cependant, le professeur Vu Ha Van a déclaré que pour certaines questions biaisées envers le Vietnam, comme « À qui appartient le drapeau brodé de six caractères dorés ? », ViGPT répondra qu'il s'agit de Tran Quoc Toan, tandis que les autres versions pourraient être erronées. À l'avenir, face à des questions aussi approfondies, ViGPT sera plus performant grâce aux retours des utilisateurs nationaux.

« Si les utilisateurs se contentent de critiquer ou pensent que ce modèle de langage complexe est encore stupide, alors que mon enfant de 10 ans connaît les questions qu'il ne connaît pas, ou posent des questions pièges pour prouver que nous sommes plus intelligents que l'IA, nous sommes plus intelligents que l'IA, mais ce n'est pas pour rien. Ici, nous n'améliorons pas le produit, mais nous déprimons ceux qui le développent. C'est pourquoi VinBigdata a besoin de la contribution commune des techniciens et de la communauté, et nous avons besoin de la collaboration des Vietnamiens pour perfectionner le produit afin qu'il ne soit pas un simple outil de service, mais qu'il fasse la fierté du peuple vietnamien », a souligné le professeur Vu Ha Van.

Prêt à soutenir et accompagner le modèle linguistique vietnamien

S'adressant à VietNamNet , des représentants de startups travaillant sur l'IA au Vietnam ont déclaré qu'ils étaient prêts à soutenir et à accompagner le modèle linguistique vietnamien de VinBigdata.

ViGPT.jpg
Soutenir et accompagner ViGPT est essentiel pour développer un grand modèle linguistique vietnamien.

M. Dinh Tran Tuan Linh, directeur technique d'Unikon Joint Stock Company, propriétaire de la plateforme Aicontent.vn, a déclaré qu'actuellement, peu de pays d'Asie ont déployé des efforts pour former avec succès leurs propres modèles linguistiques à grande échelle, la Chine, la Corée et le Japon étant les premiers à le faire. Par conséquent, ViGPT constitue un signal important pour les efforts du peuple vietnamien en matière d'investissement dans les technologies de base. Selon M. Dinh Tran Tuan Linh, tout voyage de mille kilomètres doit commencer par des premiers pas. En tant que pionnier des applications de l'IA, Unikon est disposé à contribuer, à tester, à donner son avis et même à utiliser ViGPT dans des projets à grande échelle.

M. Dang Huu Son, cofondateur de Lovinbot, a déclaré que l'écoute de la communauté et des avis des experts par VinBigdata était un atout majeur pour développer un modèle linguistique à grande échelle spécifiquement destiné aux Vietnamiens. En tant que technicien, M. Dang Huu Son a également fait part de ses commentaires à l'équipe technique de VinBigdata après avoir utilisé le produit.

Selon M. Dang Huu Son, un nouveau produit ne peut être finalisé immédiatement, ni bénéficier d'un soutien total de la communauté. Les Vietnamiens pensent depuis longtemps que le Vietnam ne peut pas mettre en œuvre cette technologie ; il faut donc encore du temps. Parallèlement, VinBigdata doit recevoir des instructions précises sur la manière dont la communauté peut mieux le soutenir et l'accompagner.

M. Dang Huu Loc, fondateur de la plateforme Mindmaid, a également indiqué que très peu de pays au monde ont actuellement mis en place un modèle de langue maternelle. Même les pays riches et dotés de solides technologies de l'information, comme l'Inde, ou les pays au PIB supérieur à celui du Vietnam, comme l'Indonésie, ou le Moyen-Orient, ne peuvent pas le faire simplement par volonté, car cela dépend aussi des caractéristiques de la langue. Par conséquent, d'un point de vue plus large, le Vietnam dispose d'un avantage stratégique dans la mise en place d'un modèle de langue maternelle, ce qui constituera un atout stratégique pour la compétitivité mondiale des Vietnamiens.

Selon M. Dang Huu Loc, tout effort visant à construire un modèle linguistique vietnamien à grande échelle est précieux et doit être analysé de manière spécifique afin de le perfectionner chaque jour, au lieu d'exploiter certaines lacunes actuelles pour nier tous les efforts des unités technologiques nationales. Les Vietnamiens devraient également diffuser largement l'importance des technologies linguistiques à grande échelle à l'ère de l'IA et discuter davantage de la manière de les appliquer pour créer de la valeur pour eux-mêmes et les entreprises vietnamiennes, au lieu de comparer le modèle linguistique vietnamien à grande échelle aux meilleurs modèles linguistiques mondiaux actuels. Étant une technologie d'IA générale, le modèle linguistique à grande échelle peut ne pas être efficace pour ce problème, mais il est adapté à d'autres problèmes spécifiques. En particulier, le modèle linguistique vietnamien à grande échelle sera plus avantageux pour les problèmes liés à la compréhension et à la génération du vietnamien.

Community ViGPT sera fourni gratuitement aux organisations à but non lucratif . VinBigdata fournira Community ViGPT gratuitement aux organisations à but non lucratif. Cependant, les organisations utilisant cette version devront prendre en charge les coûts d'infrastructure, tels que le cloud et d'autres ressources, lors du déploiement.