Dans le monde numérique, les utilisateurs ont besoin d’outils pour les aider à authentifier les informations.
À l'ère du numérique, les réseaux sociaux et les plateformes en ligne sont devenus le principal canal d'accès à l'information pour des dizaines de millions de personnes chaque jour. Cependant, outre cette commodité, la propagation fulgurante des fausses nouvelles est une réalité inquiétante. Dans ce contexte, il devient indispensable de vérifier l'information par la comparaison et la vérification de l'exactitude de ce que nous lisons, entendons et partageons.
Face à cette situation, le Centre de services de données et d'intelligence artificielle de Viettel a développé ClaimPKG, une méthode efficace de vérification des informations, applicable en pratique. Cette recherche, qui a dépassé les 5 200 études mondiales, sera présentée directement à l'ACL 2025. Il s'agit de l'une des conférences mondiales les plus importantes sur le traitement automatique du langage naturel (TALN), avec un taux d'acceptation des présentations de seulement 37 %. L'événement réunit des experts technologiques de premier plan issus de géants tels que Google, Meta, Huawei, IBM, Amazon, Oracle, etc.
ClaimPKG combine un graphe de connaissances et un modèle de langage étendu (LLM), améliorant la précision de 9 à 12 % par rapport aux méthodes actuelles lors de tests sur FactKG (un jeu de données de référence très apprécié par la communauté technologique en matière de vérification des faits). Ce résultat de test démontre le fort potentiel de ClaimPKG pour améliorer la fiabilité des futurs systèmes de vérification des faits par l'IA.
Auparavant, lors de la conférence NAACL 2025, le centre de services de données et d'intelligence artificielle de Viettel a également attiré l'attention avec VeGraph - une méthode de vérification d'informations basée sur des plateformes de connaissances textuelles telles que des articles, des documents juridiques, etc. VeGraph a enregistré une amélioration de 2 à 5 % de la précision par rapport aux autres méthodes, mais dans de nombreux cas, en particulier si les données textuelles manquent d'une structure claire, le processus de vérification peut prendre du temps et il est difficile d'assurer la cohérence.
Afin d'améliorer la précision et la cohérence, le Centre de services de données et d'intelligence artificielle de Viettel poursuit sa recherche d'une nouvelle orientation. ClaimPKG est développé selon une approche structurée basée sur les connaissances, utilisant un graphe de connaissances clairement formaté selon le modèle « sujet-relation-objet ».
Les informations à vérifier sont décomposées et transformées en un pseudo-sous-graphe. Le système récupère ensuite les connaissances associées dans le graphe de connaissances, puis laisse LLM inférer et tirer la conclusion finale. Ce processus contribue à accroître la précision, la cohérence et la fiabilité de la vérification, tout en réduisant la charge de calcul de LLM.
Les avantages techniques de ClaimPKG constituent également la base d'un développement des applications pratiques. Dans le domaine du journalisme et des médias, la technologie peut aider les journalistes et les rédacteurs en chef à détecter les fausses informations et à comparer les sources rapidement et efficacement.
Dans les domaines médical et juridique, cette technologie peut servir d'« assistant de vérification », facilitant la recherche et l'authentification de connaissances spécialisées. De plus, ClaimPKG peut être intégré à des chatbots ou des assistants virtuels, permettant ainsi au système de fournir des réponses plus fiables et d'éviter les jugements ambigus.
L'ACL 2025 (Assemblée annuelle de l'Association for Computational Linguistics), qui se tiendra du 27 juillet au 1er août à Vienne, en Autriche, est l'un des événements les plus prestigieux et les plus influents au monde dans le domaine du TALN. Réunissant des milliers de chercheurs, d'ingénieurs et d'experts internationaux, cette conférence est l'occasion de partager les dernières avancées en TALN, de l'apprentissage automatique des langues à la traduction automatique, en passant par la synthèse de textes, les réponses automatiques aux questions, en passant par les questions d'éthique et d'équité en IA linguistique.
Cette année, le thème principal de la conférence est « Généralisation des modèles PNL », mettant l’accent sur le développement de modèles capables de s’adapter et de comprendre de nouvelles données, de nouveaux langages ou de nouveaux domaines.
HA LINH
Source : https://nhandan.vn/cong-nghe-tri-tue-nhan-tao-giup-kiem-chung-thong-tin-post898494.html
Comment (0)