Vietnam.vn - Nền tảng quảng bá Việt Nam

« La maîtrise des données vietnamiennes est la première étape du développement et de la maîtrise de la technologie vietnamienne »

Báo Thanh niênBáo Thanh niên27/05/2024


TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Après avoir travaillé pour une grande organisation d’intelligence artificielle aux États-Unis, pourquoi avez-vous décidé de rentrer chez vous pour rejoindre VinBigdata ?

Lorsque je travaillais aux États-Unis, bien que j'aie participé à de nombreux grands projets gouvernementaux , les résultats que j'obtenais ne représentaient souvent que quelques étapes d'un processus plus vaste. Souvent, en raison de la stricte confidentialité des projets, je ne savais même pas comment les solutions que j'avais développées étaient utilisées.

En 2017, je suis retourné au Vietnam, alors que le pays était en pleine phase de développement et que de nombreux problèmes liés au big data et à l'intelligence artificielle restaient à résoudre. J'ai accepté l'invitation du professeur Vu Ha Van pour collaborer à l'élaboration de solutions technologiques vietnamiennes au service de la vie quotidienne des Vietnamiens. Mon retour au Vietnam a été d'autant plus enrichissant qu'il m'a permis de travailler sur des problématiques à plus fort impact.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr Dao Duc Minh lors d'un atelier

Dans la stratégie de développement de l’intelligence artificielle, quel rôle et quelle influence jouent les big data, monsieur ?

Les données jouent un rôle crucial et précieux dans l'entraînement de l'intelligence artificielle. L'entraînement d'un modèle d'intelligence artificielle de haute qualité commence souvent par l'entraînement d'une base de données volumineuse. Par conséquent, pour obtenir une intelligence artificielle de qualité, il est essentiel de disposer de données de qualité.

De bonnes données requièrent quantité, échelle, qualité, variété et universalité. Collecter et traiter des milliers d'heures de données, depuis l'étape de nettoyage des données brutes jusqu'à la création de données de la plus haute qualité destinées à alimenter des modèles d'intelligence artificielle, est un processus très coûteux et complexe. En revanche, pour analyser le big data, l'intelligence artificielle est nécessaire pour garantir la capacité de traiter les données avec précision à grande échelle, et ainsi obtenir de meilleurs résultats décisifs ou prédictifs.

Par exemple, dans le cadre du développement d'un produit d'assistant virtuel pour les Vietnamiens (ViVi), nous avons dû collecter et traiter des dizaines de milliers d'heures de données audio de haute qualité, provenant de centaines de milliers de voix de différentes régions, d'âges et de sexes divers, avec un contenu couvrant des centaines de domaines...

Ou plus récemment, le lancement de ViGPT – « la première version vietnamienne de ChatGPT destinée aux utilisateurs finaux » – développé à partir d'un modèle linguistique étendu, entièrement détenu par VinBigdata. Ce modèle est entraîné à partir de 600 Go de données vietnamiennes raffinées issues de nombreux domaines. Grâce à notre compréhension des données et de la langue vietnamiennes, nous avons trouvé une nouvelle approche pour réduire le délai de lancement de ViGPT, en seulement 9 mois après la création de ChatGPT.

C’est la résonance entre le big data et l’intelligence artificielle.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Quel est votre point de vue sur la nécessité de lier la recherche à la valeur pratique pour servir la communauté ?

- Je crois que la recherche technologique n’est véritablement fructueuse que lorsqu’elle entre réellement dans la vie, résout les problèmes sociaux et améliore la vie des gens.

Pour créer des produits commerciaux pratiques qui résolvent les problèmes commerciaux et sociaux, nous devons toujours être attentifs et nous poser la question : quelle valeur les données apporteront-elles à la vie ?

Jusqu'à présent, nous avons recherché et développé une variété de produits et de solutions pour diverses industries et domaines, généralement ViGPT, VinDr - fournissant des solutions d'IA dans le diagnostic d'imagerie médicale , VinBase - une plate-forme d'intelligence bio-artificielle, ou Vizone - un ensemble de solutions d'analyse d'images intelligentes.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Avec le personnel clé de VinBigdata lors d'un événement de Vingroup Corporation

La quatrième révolution industrielle est en plein essor à l'échelle mondiale. Quels sont, selon vous, les atouts du Vietnam ?

Par rapport aux révolutions précédentes, je crois que le Vietnam dispose actuellement de nombreux atouts pour percer dans cette révolution industrielle 4.0 et améliorer sa position sur la scène mondiale. Les deux clés pour y parvenir sont les données et les personnes.

Le Vietnam compte actuellement près de 100 millions d'habitants, dont une forte proportion de jeunes utilisent des téléphones et des ordinateurs personnels. De plus, nous disposons d'experts reconnus en intelligence artificielle et d'une jeune main-d'œuvre qualifiée en technologies de l'information, ainsi que d'excellentes bases en mathématiques.

Alors, quelles sont les limites ?

La première limitation évidente est que malgré une population importante, nous éprouvons encore des difficultés à maîtriser les données, notamment à les normaliser et à les synchroniser au niveau des installations, des unités commerciales et des administrations.

En outre, nous sommes également confrontés à d’autres contraintes telles que des ressources d’investissement limitées, notamment dans les infrastructures de calcul haute performance.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Selon vous, quelle est l’importance du rôle de la maîtrise des données vietnamiennes dans le parcours de création et de maîtrise de la technologie au service de la vie des Vietnamiens ?

Il existe actuellement de nombreux produits d'intelligence artificielle de pointe dans le monde, notamment des applications d'IA génératives basées sur de grands modèles linguistiques, comme ChatGPT d'OpenAI ou Bard de Google. Cependant, le vietnamien n'est pas la langue principale utilisée pour le développement de ces produits.

Par conséquent, la qualité du contenu spécifique au vietnamien renvoyé aux utilisateurs est plus ou moins affectée et présente une forte possibilité d'erreurs, plus dangereusement, d'erreurs dans les connaissances de base.

En tant que Vietnamiens, nous avons l'avantage d'accéder à nos propres sources de données. Nous sommes les seuls à pouvoir comprendre les caractéristiques des données vietnamiennes, ainsi que les besoins et les particularités de la population vietnamienne. Par conséquent, la maîtrise des données vietnamiennes est essentielle pour maîtriser les technologies clés, qui serviront les Vietnamiens.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Formation interne pour les membres de VinBigdata

Comment accéder à des sources de données spécifiques, surtout lorsque la plupart des Vietnamiens utilisent aujourd’hui des sites de réseaux sociaux depuis l’étranger ?

En réalité, la plus grande source de données humaines aujourd'hui (pas seulement vietnamiennes) se trouve sur Internet et les réseaux sociaux. Cependant, nous pouvons toujours accéder à des données et les collecter à partir de différentes sources, en fonction de la compréhension des caractéristiques des données vietnamiennes et des spécificités définies par chaque projet.

Par exemple, les modèles GPT d'OpenAI comportent des centaines, voire des milliards de paramètres, sont entraînés sur d'énormes quantités de données et coûtent des milliards de dollars. Par rapport à eux, nous avons choisi une voie totalement différente, fondée sur nos recherches, nos capacités et nos ressources : créer un modèle de langue vietnamienne avec une architecture de seulement quelques milliards de paramètres, entraîné sur un ensemble de données vietnamiennes de 600 Go que nous avons collectées et affinées nous-mêmes, mais avec des capacités de traitement équivalentes. Les résultats montrent que notre architecture auto-développée peut s'auto-optimiser, raccourcir le temps d'entraînement du modèle de langue, réduire les coûts, tout en garantissant la qualité du modèle.

Quels sont les défis que vous et votre équipe avez rencontrés dans le processus de recherche et de développement de produits d’intelligence artificielle ?

Le premier défi est sans aucun doute le temps. La vague technologique de l'intelligence artificielle arrive à grands pas et connaît une période d'explosion. Partout dans le monde, les plus grandes entreprises technologiques ont rapidement lancé des produits très complets, constamment mis à jour et améliorés. Si nous tardons à lancer nos produits à temps, nous risquons de prendre du retard.

D’autre part, si nous voulons créer des produits qui peuvent être appliqués et résoudre des problèmes sociaux pratiques, nous devons également envisager de trouver et de développer les caractéristiques exceptionnelles, spéciales et uniques du produit.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Présentation à la Journée de l'intelligence artificielle au Vietnam (AI4VN 2023)

En réalité, de nombreuses personnes et organisations au Vietnam et dans le monde ont subi d'importantes pertes suite à des fuites de données. Comment percevez-vous la question de la sécurité des données ?

On peut dire que toute application actuelle est issue des données. L'exploitation des données doit, d'une part, garantir leur application pour créer les meilleures technologies pour la vie et, d'autre part, garantir la sécurité des données pour les individus et les organisations.

Le facteur humain est un maillon essentiel du processus d'assurance de la sécurité des données. Il inclut les développeurs, les utilisateurs de produits et les utilisateurs. Pour les développeurs, la sensibilisation à la sécurité des données doit être présente dès le début de la collecte et du traitement des données.

Souvent, en l'absence de problème, nous ignorons l'importance de la sécurité des données. Pourtant, une fuite de données peut entraîner des dommages considérables. Elle peut être due à des problèmes techniques ou à des attaques intentionnelles visant à voler des données. En cas de fuite de données, les informations des individus ou des organisations peuvent être utilisées par des individus malintentionnés à des fins illégales, et les entreprises peuvent subir des pertes financières pour résoudre les problèmes, voire nuire à leur image de marque.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Le Dr Dao Duc Minh et l'équipe VinBigdata lors d'un événement

Après l'aspiration à maîtriser la technologie pour servir le peuple vietnamien, y aura-t-il des étapes pour progresser vers le monde ?

Toute organisation ou entreprise souhaitant commercialiser ses produits à l'international doit se conformer aux normes internationales. VinBigdata possède des atouts en matière de solutions et de technologies ; il est donc naturel de se fixer une vision pour conquérir le monde.

Bien entendu, pour déployer de nombreux produits et applications différents, il est nécessaire de bénéficier du soutien d'unités internationales disposant de nombreuses années d'expérience et de compréhension des utilisateurs du monde entier.

Merci!



Source : https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Comment (0)

No data
No data

Même sujet

Même catégorie

Des feux d'artifice explosent, le tourisme s'accélère, Da Nang marque des points à l'été 2025
Découvrez la pêche nocturne au calmar et l'observation des étoiles de mer sur l'île aux perles de Phu Quoc
Découvrez le processus de fabrication du thé de lotus le plus cher de Hanoi
Admirez la pagode unique fabriquée à partir de plus de 30 tonnes de pièces en céramique à Ho Chi Minh-Ville

Même auteur

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit