Un MMO pour entraîner les IA à survivre

Des chercheurs utilisent un jeu en ligne massivement multijoueurs (MMO) afin de créer des Intelligences artificielles plus performantes et plus complexes. Baptisé « Neural MMO », le jeu vidéo développé par OpenAI est un jeu open source spécialement destiné aux algorithmes.

Son environnement est constitué de tuiles représentant des pierres, d’herbe, de lave, de forêts, d’eau et de broussailles.

Cerveau

Crédits Pixabay

Les agents de l’IA sont regroupés par « espèces ». Ceux qui appartiennent à la même espèce ne s’attaquent pas entre eux. Les ressources sont limitées. Il existe des sources d’eau infinies, mais la nourriture est rare et prend du temps à réapparaitre. Les agents de l’IA devront ainsi apprendre à survivre dans ce monde relativement similaire à la réalité.

Neural MMO a été conçu par Joseph Suarez, Yilun Du, Phillip Isola et Igor Mordatch, des chercheurs d’OpenAI. Ils ont publié le code du jeu lundi dernier, via GitHub.

La volonté d’éviter les confits les a poussés à explorer davantage

Au début, les agents sont en bonne santé. Ils ont la capacité d’attaquer de près s’ils souhaitent faire un maximum de dégâts. Ils peuvent également lancer l’assaut à distance, en recourant à une sorte de gel qui stoppe leurs adversaires.

L’un des premiers constats des chercheurs est que plus il y a eu de concurrence, plus la carte du jeu a été explorée. « Les agents apprennent à explorer uniquement parce que la présence d’autres agents constitue une incitation naturelle à le faire », ont noté les auteurs. Ainsi, pour éviter des conflits, les IA ont évolué en faisant davantage de découvertes.

Neural MMO n’est encore qu’à ses débuts. Ses concepteurs espèrent que des développeurs leur proposent des extensions pour l’améliorer.

Le meilleur moyen d’entrainer les IA ?

 « Nous considérons [les MMO] comme le meilleur indicateur du monde réel parmi les jeux humains : ce sont des macrocosmes complets comportant des milliers d’agents par monde persistant, des systèmes de compétences variés, des économies mondiales et des enjeux uniques ad hoc et par équipe », a écrit l’équipe sur GitHub.

« La vie sur Terre peut être considérée comme une compétition multiagents massive », ont déclaré les chercheurs. « Le guépard développe un profil aérodynamique afin de capturer la gazelle, la gazelle développe des jambes élastiques pour courir encore plus vite : les espèces ont développé de nouvelles capacités afin de surpasser leurs adversaires. »