Cette intelligence artificielle confère un certain bon sens aux robots

Une nouvelle approche de la vision par ordinateur, fondée sur le « bon sens », permet à l’intelligence artificielle d’interpréter les scènes avec plus de précision que les autres systèmes. Les systèmes de vision par ordinateur font parfois des déductions sur une scène qui vont à l’encontre du bon sens. Avec le déploiement du même système sur une voiture autonome, par exemple, les enjeux deviennent beaucoup plus importants.

œil de robot

Pour surmonter ces erreurs, les chercheurs du MIT ont mis au point un cadre qui aide les machines à voir le monde comme les humains. Leur nouveau système d’intelligence artificielle apprend à percevoir les objets du monde réel. Les chercheurs ont construit le cadre en utilisant la programmation probabiliste, une approche basée sur la technologie de l’IA.

Celle-ci permet au système de recouper les objets détectés avec les données d’entrée. L’inférence probabiliste lui permet de déduire si les non-concordances sont probablement dues au bruit ou à des erreurs dans l’interprétation de la scène.

Quels avantages avec la garantie de bon sens ?

Cette garantie de bon sens permet au système de détecter et de corriger de nombreuses erreurs. Ces erreurs affectent les approches d’apprentissage profond, également utilisé pour la vision par ordinateur. La programmation probabiliste permet aussi de déduire les relations de contact possibles entre les objets de la scène. Elle offre même la possibilité de déduire les positions précises des objets.

En plus d’améliorer la sécurité des voitures à conduite autonome, ces travaux pourraient aider dans les performances des systèmes de perception informatique. Cette recherche sera présentée à la conférence sur les systèmes de traitement de l’information neuronale de ce mois de décembre.

Une explosion du passé

Les chercheurs se sont inspirés d’un concept datant des premiers jours de la recherche en IA. Si l’infographie se concentre sur la génération d’images basées sur la représentation d’une scène, la vision par ordinateur peut être considérée comme l’inverse de ce processus. Gothoskar et ses collaborateurs ont rendu cette technique plus facile à apprendre et à mettre à l’échelle.

« La programmation probabiliste nous permet d’écrire nos connaissances sur certains aspects du monde d’une manière qu’un ordinateur peut interpréter. »

M. Cusumano-Towner

Dans ce cas, le modèle est encodé avec des connaissances préalables sur les scènes 3D. Par exemple, 3DP3 « sait » que les scènes sont composées de différents objets, et que ces objets sont souvent posés à plat les uns sur les autres. Cependant, ils ne sont pas toujours dans des relations aussi simples. Cela permet au modèle de raisonner sur une scène avec plus de bon sens.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.