L’utilisation de la théorie des jeux pour améliorer la performance des modèles de langage

Cet article explore comment les chercheurs en IA utilisent la théorie des jeux pour concevoir des modèles de langage plus performants et fiables. En s’inspirant du jeu de Diplomatie, ils ont développé un “jeu du consensus” où deux systèmes d’IA, un générateur et un discriminateur, doivent coopérer pour répondre correctement à des questions. Cette approche incite les modèles à s’appuyer sur leurs connaissances du monde réel plutôt que de simplement chercher à maximiser leurs points, les rendant ainsi plus précis et fiables.

Points clés

  • Le jeu de Diplomatie, avec ses multiples joueurs et alliances mouvantes, a inspiré les chercheurs en IA pour concevoir de nouveaux systèmes plus complexes
  • L’équipe de Meta a réussi à créer un programme IA, Cicero, capable d’un niveau de jeu “humain” au jeu de Diplomatie
  • Le “jeu du consensus” développé au MIT incite deux systèmes IA, un générateur et un discriminateur, à coopérer pour répondre correctement à des questions
  • Le générateur reçoit une question et des réponses possibles, dont une correcte, et doit choisir de répondre correctement ou non selon le résultat d’un tirage au sort
  • Le discriminateur doit alors deviner si la réponse envoyée était intentionnellement correcte ou non, les deux étant récompensés s’ils s’accordent
  • Cette approche encourage les modèles à s’appuyer sur leurs connaissances du monde réel plutôt que de simplement maximiser leurs points

À retenir

En utilisant les principes de la théorie des jeux, les chercheurs en IA ont réussi à concevoir des modèles de langage plus performants et fiables. Plutôt que de se concentrer uniquement sur la maximisation du score, ces systèmes sont incités à s’appuyer sur leurs connaissances du monde réel pour générer des réponses précises. Une approche innovante qui devrait permettre de faire progresser l’IA dans des domaines complexes comme le dialogue naturel.

Sources