Le concours « Traitement de la parole et de la langue vietnamienne » (VLSP) s'inscrit dans le cadre de la conférence internationale annuelle sur le traitement de la parole et de la langue vietnamienne, organisée par le club VLSP, branche de l'Association vietnamienne des technologies de l'information. VLSP 2023 organise dix concours sur le traitement de la parole et du texte, réunissant des chercheurs, des experts et des équipes de développement technologique de premier plan. Participant à ce concours, Viettel AI a remporté le premier prix dans deux catégories : reconnaissance vocale et reconnaissance des émotions ; traduction automatique vietnamien-laotien.

La reconnaissance automatique de la parole est l'un des problèmes majeurs du traitement de la parole, qui consiste à convertir les signaux vocaux d'entrée en texte. Cette année, grâce à l'innovation apportée à la structure des catégories du concours, les équipes ont dû résoudre deux problèmes simultanément : la reconnaissance vocale et la reconnaissance des émotions. Viettel AI a non seulement relevé ce défi pour remporter le premier prix, mais a également impressionné avec un score exceptionnel de 89,18 % (les équipes suivantes ont obtenu respectivement 83,40 % et 78,45 %).

Selon un représentant de Viettel AI, l'élément clé de cette précision exceptionnelle réside dans la maîtrise précoce de la technologie par Viettel AI. Au lieu d'utiliser des modèles issus de recherches existantes, Viettel AI a développé un modèle spécifique au traitement de la parole vietnamienne de A à Z, dont l'efficacité a été continuellement améliorée et mise à jour. Grâce à un cycle d'apprentissage capable de traiter toutes les données dans différentes conditions de qualité, les ingénieurs ont réussi à construire un modèle capable de reconnaître le texte et les émotions de la phrase avec une grande précision, même dans des conditions de données limitées.

aaaaaaaaaaaaa.jpg
Les ingénieurs de la plateforme d'assistant virtuel Viettel AI participent aux catégories Reconnaissance vocale et Reconnaissance des émotions vocales

La technologie avancée de traitement vocal a apporté des résultats significatifs aux produits d'IA de Viettel, tels que les systèmes d'assistants virtuels et les standards virtuels capables de reconnaître la voix avec une précision allant jusqu'à 95 % et d'identifier les intentions des clients avec une précision allant jusqu'à 96 %. En particulier, les résultats des recherches sur la technologie de reconnaissance vocale et émotionnelle menées par la concurrence ouvriront de nouvelles applications au service client, exploitant les informations des appels au standard. Les plaintes et les appels négatifs des clients au standard représentent souvent un petit nombre parmi les centaines de milliers d'appels quotidiens, mais ont un impact considérable sur la qualité du service. Au lieu de dépenser de l'argent pour embaucher du personnel pour écouter et enregistrer ces appels comme auparavant, le standard virtuel Viettel Cyberbot sera capable d'identifier et de traiter automatiquement les plaintes des clients dès leur réception.

À travers ce concours, Viettel AI affirme sa détermination à être pionnier dans le développement et l'application des technologies de traitement de la parole les plus avancées pour améliorer la qualité des produits et des services.

Quoc Tuan