Clicky

Deezer a conçu une IA capable de détecter l’ambiance musicale d’une chanson

Les chercheurs de Deezer ont réalisé un travail consistant à développer un système d’intelligence artificielle capable de relier des chansons à des humeurs et des intensités. Cette recherche a été publiée dans un article sur Arxiv.org sous l’intitulé : « Détection de l’humeur musicale basée sur des paroles audio avec des réseaux neuraux profonds. »

Pour réaliser cette étude, les ingénieurs ont commencé par introduire des signaux audio et des modèles contextuels des mots dans un réseau neuronal. Ils ont ensuite utilisé l’ensemble des métadonnées de Million Song (MSD) pour apprendre à l’intelligence artificielle à identifier l’ambiance d’une chanson.

Les experts se sont aussi inspirés des données sur les identifiants de Last.fm pour former le système à déterminer le caractère calme ou énergique d’une musique.

Une nouvelle expérience musicale aux auditeurs

Deezer n’en est pas à son premier essai pour concevoir une intelligence artificielle capable de détecter l’ambiance musicale. Lors du festival Sónar de 2017, une question a suscité beaucoup d’intérêt et a lancé un challenge : « Quand un utilisateur est chez lui, comment détecter le contexte dans lequel il écoute de la musique et recommander la musique en conséquence ? »

L’objectif de Deezer est ainsi de concevoir une intelligence artificielle qui sera non seulement capable de trier et de sélectionner des chansons, mais aussi d’en proposer en se basant sur des paramètres plus complexes comme l’humeur de l’auditeur.

Une IA en mesure de détecter la nature d’une chanson

Les ingénieurs de Deezer ont constaté que l’intelligence artificielle savait mieux détecter la nature calme ou énergique, positive ou négative, d’une musique que les autres approches effectuées par les chercheurs qui n’avaient pas recours à l’intelligence artificielle.

Ils déclarent que « Ce gain de performance résulte de la capacité de notre modèle à dévoiler et à utiliser des corrélations de niveau intermédiaire entre l’audio et les paroles, en particulier lorsqu’il s’agit de prédire la valence. »

Néanmoins, les ingénieurs pensent que leur travail serait plus fructueux s’ils disposaient d’une « base de données avec des paroles et du son synchronisés. » Le MSD utilisé par les chercheurs durant leur recherche ne comprend que des métadonnées sur les chansons et non les chansons elles-mêmes. Il a donc fallu que l’équipe associe ces données au catalogue de Deezer et recherche des identifiants comme les noms d’artistes, les titres de l’album et les titres des chansons.

Au total, 18 644 pistes soit environ 60% des MSD ont servi à former l’intelligence artificielle tandis que le reste des métadonnées a été utilisé pour tester et améliorer le système.

Mots-clés deezer

Andy

Passionné de NTIC, sportif et à ce que l'on dit, un bon vivant !