OpenAI offre un accès limité à la plateforme Voice Engine !

La startup d’intelligence artificielle OpenAI travaille activement depuis fin 2022 sur un système d’IA de clonage vocal. Baptisé « Voice Engine », celui-ci n’a besoin que d’un échantillon de 15 secondes pour fonctionner normalement. À terme, ses capacités seront améliorées afin qu’il soit intégré à la fonctionnalité Read Aloud dans ChatGPT.

OpenAI
Crédit Photo : Unsplash

Générer du contenu voix off pré-scénarisé

Avec un extrait de 15 secondes seulement, Voice Engine peut créer une voix synthétique de bonne qualité. Ce système de clonage vocal a en effet été formé sur un mélange de données sous licence et accessibles au public. À cet effet, il est en mesure de lire des invites textuelles sur commande dans la même langue que l’opérateur ou dans d’autres langues. Pour autant, la publication du modèle ne serait disponible que pour une dizaine de développeurs.

Avant ceci, OpenAI indique que sa technologie avait déjà été intégrée à des plateformes en ligne. Elle a notamment alimenté des voix prédéfinies pour l’API de synthèse vocale et la fonction de lecture à haute voix de ChatGPT. Dans un article de blog, OpenAI affirme à ce sujet : « Ces déploiements à petite échelle contribuent à éclairer notre approche, nos garanties et notre réflexion sur la manière dont Voice Engine pourrait être utilisé à bon escient dans divers secteurs ».

Parmi les entreprises ayant accès à cette plateforme, il y a entre autres la société de technologie Age of Learning. Il y a également la plateforme de narration visuelle HeyGen, le fabricant de logiciels de santé Dimagi et le système de santé Lifespan. La génération de texte en audio par l’IA est un domaine qui continue de se perfectionner. Cependant, il convient de préciser que moins d’acteurs s’intéressent à la génération de voix, en partie à cause des questions citées par OpenAI.

À lire aussi : OpenAI s’associe à Business Insider et Politico pour améliorer ChatGPT !

Encadrer l’utilisation des technologies vocales d’IA

Alors que la génération de texte en audio par l’IA se développe, le gouvernement américain tente d’encadrer le secteur. À cet effet, il envisage de freiner les utilisations contraires à l’éthique de cette technologie. Le mois dernier, la Federal Communications Commission (FCC) a par exemple interdit les appels automatisés utilisant des voix synthétiques. Cela fait suite à de nombreux appels indésirables provenant d’une voix clonée par l’IA à partir de celle du président Joe Biden.

Pour réduire ces nombreux risques, OpenAI a suggéré plusieurs mesures pratiques. Celles-ci englobent la suppression progressive de l’authentification vocale pour accéder aux comptes bancaires et le développement de système de suivi de contenu IA. La startup propose aussi la mise en place de certaines politiques visant à protéger l’utilisation de la voix des personnes dans le secteur.

Les divers partenaires d’OpenAI prennent un engagement formel. Ils garantissent qu’ils n’utiliseraient pas Voice Engine pour usurper l’identité de personnes ou organisation sans leur consentement. De même, ils doivent obtenir l’aval de l’orateur d’origine avant de s’en servir dans le cadre de leurs activités.

Source : The Verge

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.