L’IA au service des preuves formelles

DeepSeek-AI a dévoilé DeepSeek-Prover-V2, un grand modèle linguistique open source conçu pour la démonstration de théorèmes formels. Ce modèle innovant combine la décomposition en sous-objectifs et l’apprentissage par renforcement pour naviguer dans la complexité de la logique formelle. Il vise à combler le fossé entre le raisonnement informel des modèles linguistiques et la rigueur exigée par les assistants de preuve comme Lean et Coq.

Points clés

  • Le raisonnement mathématique formel est un sous-domaine spécialisé de l’intelligence artificielle nécessitant une cohérence logique stricte.
  • Les assistants de preuve comme Lean, Coq et Isabelle fournissent les cadres structurels pour la construction de preuves formelles.
  • Les modèles linguistiques actuels peinent à faire le lien entre le raisonnement informel et la précision structurelle des systèmes de logique formelle.
  • DeepSeek-Prover-V2, développé par DeepSeek-AI, utilise la décomposition en sous-objectifs et l’apprentissage par renforcement pour générer des preuves formelles.
  • Le modèle s’appuie sur DeepSeek-V3 pour décomposer les théorèmes complexes en sous-objectifs gérables.
  • Un modèle de preuve de 7 milliards de paramètres complète chaque étape de preuve.
  • La formation du modèle est entièrement amorcée à partir de données synthétiques, sans aucune annotation humaine.
  • DeepSeek-Prover-V2 a atteint un taux de réussite de 88,9 % sur le benchmark MiniF2F-test (Pass@8192).
  • Il a résolu 49 problèmes sur 658 du dataset PutnamBench.
  • Le modèle a abordé 6 problèmes sur 15 des compétitions AIME 2024-2025.
  • Un nouveau benchmark, ProverBench, composé de 325 problèmes formalisés, a été introduit.

À retenir

Alors, si vous pensiez que les maths formelles étaient réservées à une élite de génies en blouse blanche, détrompez-vous ! Avec DeepSeek-Prover-V2, même une IA peut s’y mettre. Bon, ne vous attendez pas à ce qu’elle vous aide à résoudre vos équations différentielles pour l’instant, mais qui sait, peut-être qu’un jour elle prouvera que votre devoir de maths était correct… ou pas. En tout cas, c’est une bonne nouvelle pour ceux qui aiment la logique et les preuves irréfutables, même si pour le commun des mortels, ça reste un peu… abstrait.

Sources