Une Britannique atteinte d'une maladie du motoneurone (MND), qui l'a rendue incapable de parler, a pu à nouveau communiquer en utilisant sa propre voix grâce à la technologie de l'intelligence artificielle (IA) et à un enregistrement de huit secondes tiré d'une vieille vidéo familiale.
Sarah Ezekiel, une artiste vivant dans le nord de Londres, a perdu la capacité de parler après avoir reçu un diagnostic de SLA à l'âge de 34 ans alors qu'elle était enceinte de son deuxième enfant il y a 25 ans.
La maladie endommage le système nerveux, affaiblissant les muscles de la langue, de la bouche et de la gorge, ce qui fait que certains patients perdent complètement la capacité de parler.
Pendant des années, Ezekiel a utilisé un ordinateur et une technologie de génération vocale pour communiquer, mais sa voix ne ressemblait pas à la sienne. Ses deux enfants, Aviva et Eric, ont grandi sans jamais connaître la véritable voix de leur mère.
Ces dernières années, les experts ont pu utiliser la technologie pour recréer la voix originale d'une personne. Cependant, cette technique nécessite de longs enregistrements de haute qualité, et la voix obtenue est souvent considérée comme « monotone ».
Simon Poole, un représentant de la société britannique de communication médicale Smartbox, a déclaré que la société avait initialement demandé à Mme Ezekiel de fournir un enregistrement de 60 minutes.
Cependant, Mme Ezekiel n'a pu trouver qu'un extrait très court et de mauvaise qualité, tiré d'une vidéo personnelle des années 1990. L'extrait ne durait que 8 secondes, contenait un son déformé et du bruit provenant de la télévision.
M. Poole s'est tourné vers la technologie développée par ElevenLabs, une société de génération de voix basée à New York qui peut recréer des voix réalistes avec très peu de données.
M. Poole a utilisé un outil d’IA pour extraire la voix de l’ancien enregistrement, puis a utilisé un autre outil – formé sur des données vocales réelles – pour créer le produit final.
Le résultat a profondément ému Ezekiel. La voix reconstituée était très proche de sa vraie voix, avec son accent londonien caractéristique et son léger zézaiement qu'elle n'appréciait pas auparavant.
Selon l'Association MND du Royaume-Uni, jusqu'à huit personnes sur dix atteintes de cette maladie éprouvent des difficultés d'élocution après le diagnostic. Cependant, les voix synthétiques actuelles sont souvent critiquées pour leur manque de rythme et d'émotion.
M. Poole a déclaré que l'avancée technologique de l'IA réside aujourd'hui dans la capacité à créer des voix humaines et émotionnelles, insufflant ainsi de la vie à des voix informatiques jusqu'alors arides. Il a souligné que la personnalisation de la voix est également un moyen de préserver l'identité personnelle.
Les personnes qui risquent de perdre leur capacité de parole en raison de maladies telles que la SLA sont désormais souvent encouragées à enregistrer leur voix dès que possible afin de préserver leur identité et de faciliter la communication future.
Cependant, avant que les smartphones ne deviennent populaires, obtenir des enregistrements corrects n'était pas facile.
Source : https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp
Comment (0)