Les petits modèles linguistiques : l’avenir de l’IA agentique ?

SLM : l’avenir de l’IA agentique

Alors que la course aux modèles linguistiques toujours plus grands (LLM) bat son plein, une étude de NVIDIA Research suggère que les petits modèles linguistiques (SLM) sont en réalité plus adaptés à l’IA agentique. Ces SLM, efficaces et économiques, excellent dans les tâches spécialisées et répétitives, offrant une alternative performante aux LLM généralistes. Cette approche modulaire promet une IA plus flexible, facile à déployer et à maintenir.

Points clés

OpenAI, SoftBank et Oracle prévoient de dépenser 500 milliards de dollars dans le projet Stargate pour construire des centres de données IA.
Meta recrute massivement pour développer la superintelligence.
Une étude de NVIDIA Research affirme que les petits modèles linguistiques (SLM) sont plus appropriés pour l’IA agentique.
L’IA agentique décompose les tâches en étapes plus petites, prend des décisions sur l’utilisation d’outils et effectue des fonctions spécifiques.
40 % à 70 % des appels de LLM dans des systèmes agentiques open-source comme MetaGPT, Open Operator et Cradle pourraient être remplacés par des SLM.
Google Gemma 3n est un exemple de SLM efficace, supportant texte, image et audio avec une faible empreinte mémoire (2-3 Go).
Microsoft Phi-2 (2,7 milliards de paramètres) égale ou surpasse des modèles de 30 milliards de paramètres en raisonnement et génération de code, tout en étant 15 fois plus rapide.
NVIDIA Hymba-1.5B surpasse des modèles de 13 milliards de paramètres en suivi d’instructions avec un débit trois fois supérieur.
DeepSeek-R1-Distill-Qwen-7B a démontré des capacités de raisonnement supérieures à GPT-4o et Claude 3.5 Sonnet.
Harkirat Behl, chercheur chez Microsoft, souligne que la performance d’un modèle dépend de la qualité des données d’entraînement, et non uniquement de sa taille.

À retenir

Alors que certains s’évertuent à construire des mastodontes de l’IA à coups de milliards, d’autres, plus malins, nous rappellent que la taille ne fait pas tout. Apparemment, les petits modèles linguistiques sont les vrais champions de l’IA agentique, capables de faire le travail sans vider votre portefeuille ou exiger une centrale électrique dédiée. Qui aurait cru que la modestie serait la clé du succès dans le monde de l’intelligence artificielle ? Il semblerait que l’avenir soit aux “Lego” de l’IA, où chaque petite brique spécialisée contribue à un ensemble complexe, plutôt qu’à une seule et énorme brique qui fait tout, mais pas forcément bien. Finalement, la taille, ça compte, mais pas toujours dans le sens où on l’imagine !

Sources