Meta lance SeamlessM4T, un outil de transcription et traduction dans 100 langues

Dans une avancée significative vers une communication sans frontières, Meta a lancé un nouveau modèle d’IA, nommé SeamlessM4T. Il s’agit d’un outil capable de transcrire et de traduire près de 100 langues, tant dans le texte qu’à l’oral.

Crédits : Meta
Crédits : Meta

La mise à disposition de cette technologie en open source marque une étape majeure dans le domaine de la traduction assistée par intelligence artificielle.

SeamlessM4T : c’est quoi au juste ?

SeamlessM4T, le tout dernier-né de Meta, est décrit par la société comme une « percée significative » dans le domaine de la traduction par IA. Il se positionne comme un successeur de projets antérieurs tels que No Language Left Behind et Universal Speech Translator. Ce modèle multitâche se base sur la reconnaissance vocale, l’identification de la langue et la synthèse vocale, s’étendant à environ une centaine de langues.

Meta n’est pas le seul acteur dans ce domaine, puisque des géants tels qu’Amazon, Microsoft, Google, OpenAI et d’autres startups ont investi dans le développement d’outils de traduction et de transcription par IA. Mais SeamlessM4T se distingue par son ambition de combiner à la fois la transcription et la traduction en un seul modèle.

SeamlessM4T : comment ça marche ?

Pour mettre au point SeamlessM4T, Meta a avoué avoir rassemblé des textes et des discours accessibles au public. L’entreprise a aligné 443 000 heures de discours avec des textes, créant 29 000 heures d’alignements « parole-à-parole ». Cela a permis d’enseigner à SeamlessM4T comment transcrire la parole en texte, traduire du texte.

Selon les affirmations de Meta, SeamlessM4T a performé mieux que les modèles actuels en ce qui concerne la transcription de la parole en présence de bruits de fond et de variations de locuteurs. La combinaison riche de données vocales et textuelles lors de l’entraînement est citée comme la raison de cette différence de qualité par rapport aux autres outils.

Débats éthiques et problèmes potentiels

Bien que SeamlessM4T représente une avancée technologique, il n’est pas exempt de controverses et de défis. En effet, certains créateurs de contenu se sont opposés à l’exploitation de données publiques pour former des modèles d’IA pouvant être utilisés commercialement.

De plus, Meta admet que les données qu’elle a extraites pourraient contenir des informations personnellement identifiables, même si elles proviennent principalement de sources en open source ou sous licence.

Par ailleurs, des préoccupations demeurent quant aux biais potentiels du modèle. Des cas de biais de genre ont été signalés, où le modèle a tendance à généraliser vers des formes masculines lors de la traduction à partir de termes neutres. SeamlessM4T a quelques fois également sorti des traductions grossières dans certaines langues. Il faut avouer que les modèles d’IA ne sont pas toujours aussi performants que l’on pense.

À lire aussi : ChatGPT : un avocat se fait piéger par l’intelligence artificielle…

Toutefois, avec les avantages que SeamlessM4T propose, ses résultats peuvent se positionner parmi les outils les plus avancés dans le système multitâche. Cependant, Meta déconseille sa réalisation pour des traductions longues et certifiées, comme celles reconnues par les autorités gouvernementales et de traduction, et le déconseille également pour des fins médicales ou juridiques.

Face à toutes ces innovations, la prudence demeure de mise, car la perte de richesse lexicale et les erreurs de traduction par IA peuvent avoir des conséquences graves.

Source : engadget

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.