La nouvelle IA de Microsoft peut imiter la voix en un temps record

L’ère de l’intelligence artificielle est vraiment lancée. Les plus pessimistes diront que l’humanité se rapproche à grands pas du soulèvement des machines. Difficile de leur donner complètement tort quand on voit ce que l’IA est aujourd’hui capable de faire.

intelligence artificielle

Récemment, une IA a réussi à décrypter le code mécanique de l’ADN. Ce qui reste impossible pour l’intelligence humaine. Et cet exploit n’est rien à côté de ce qu’est capable de réaliser la nouvelle technologie mise au point par Microsoft. Intitulée VALL-E, elle est capable de reproduire n’importe quel son en seulement trois secondes.

VALL-E : un appeau numérique capable d’imiter la voix humaine

Après avoir dévoilé précédemment des modèles d’IA capables de converser avec une personne, Microsoft est revenue cette fois-ci avec une technologie capable de reproduire la voix de personnes vivantes. Pour ce faire, l’outil est capable de parvenir à des résultats satisfaisants en se servant simplement d’un enregistrement de trois secondes provenant de la voix à reproduire.

Ce qui suffit généralement à reproduire les émotions et les intonations de la personne dont il s’approprie la voix. Ce qui lui permet de créer à sa guise des enregistrements dans lesquels on retrouve même des mots que l’intéressé n’a jamais prononcés.

Il faut dire qu’aucune intelligence artificielle n’avait jamais réussi à faire aussi mieux que VALL-E dans ce domaine. Pour atteindre ce niveau, l’outil a bénéficié d’un entrainement à partir de 60 000 heures de données vocales. Toutefois, l’IA n’est pas encore parfaite selon un article de l’université Cornell. Ce dernier a réussi à utiliser la technologie pour reproduire plusieurs échantillons de voix.

Si certains sont très naturels, d’autres par contre sont trop robotiques. Ce qui pourrait néanmoins suffire pour le nouveau projet de livres audio narrés par l’IA d’Apple. Au grand dam des doubleurs de voix et des transcripteurs audio qui pourraient bientôt permettre leur travail.

À LIRE ÉGALEMENT : 5 bonnes raisons de se faire former en Intelligence Artificielle

Une invention qui soulève avant tout des questions d’éthique

Les résultats obtenus grâce au VALL-E sont certes satisfaisants, mais sont encore loin d’être parfaits. À cet effet, Microsoft a indiqué qu’il travaillait à le rendre beaucoup plus performant.

En attendant, on peut se demander si ce type de technologie ne va pas créer plus de problèmes qu’il n’en résout. Nul doute que les résultats que nous aurons grâce à eux dans les années seront proches de la perfection. De ce fait, s’ils tombent dans les mains de personnes mal intentionnées les conséquentes pourraient être terribles. Les faussaires pourraient l’utiliser par exemple pour se faire passer pour leurs victimes.

Dans le monde de la politique, ils pourraient permettre à certains de faire dire à leurs adversaires de faux propos. On se souvient des deux citoyens russes qui avaient réussi à se faire passer au téléphone pour le président Emmanuel Macron afin de discuter sans problème avec le président polonais Andrzej Duda. Sans bien sûr parler des deepfakes qui font des dégâts immenses.

Pour finir, il faut souligner que le VALL-E pose également des soucis de sécurité. Certaines entreprises, généralement les établissements financiers, se servent de la reconnaissance vocale pour contrôler l’identité des appelants. Si les voix générées par l’IA deviennent réalistes, elles pourraient sans aucun problème faire sauter ce type de verrou.

Source : Gizmochina

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.