MADRID : Diagnostics multi-agents pour la robustesse via la diversité éclairée

Améliorer la résilience des systèmes multi-agents grâce à MADRID

Dans le domaine en pleine expansion des systèmes multi-agents, assurer la robustesse face à des environnements inconnus et hostiles est crucial. Bien que ces systèmes affichent des performances remarquables dans des contextes familiers, ils peinent souvent à s’adapter à de nouvelles situations en raison d’un surapprentissage pendant la phase d’entraînement. L’article présente MADRID, une approche innovante qui génère des scénarios adverses diversifiés afin d’exposer les vulnérabilités stratégiques des politiques multi-agents préentraînées. MADRID explore de manière systématique l’espace des paramètres adverses, en s’appuyant sur le regret des politiques cibles pour identifier les points faibles.

Points clés

MADRID utilise MAP-Elites, une approche de diversité qualitative, pour explorer l’espace des scénarios adverses
MADRID cible TiZero, l’état de l’art dans le jeu de football de Google Research, qui a “maîtrisé” le jeu en 45 jours d’entraînement
Les évaluations montrent que MADRID peut générer de nombreux paramètres adverses où TiZero affiche de piètres performances, permettant à des politiques plus faibles de le surpasser jusqu’à 70% du temps
MADRID explore de manière itérative l’espace des paramètres, en raffinant et en étendant son répertoire de scénarios adverses performants
MADRID met en évidence des lacunes dans la prise de décision tactique de TiZero, soulignant l’importance cruciale d’une évaluation rigoureuse des systèmes multi-agents

À retenir

Les résultats impressionnants de MADRID montrent que même les meilleurs systèmes multi-agents peuvent présenter des faiblesses stratégiques importantes lorsqu’ils sont confrontés à des situations adverses diversifiées. Cette approche innovante ouvre la voie à une évaluation plus approfondie et à l’amélioration de la robustesse des agents intelligents, un défi essentiel pour l’avenir des systèmes multi-agents.

Sources