Prise en main de GPT-5 : vers l’âge de pierre des agents IA

Outils, parallélisme et un bond pour le code

Nous avons pris en main GPT-5 en bêta développeur et constaté un virage décisif vers des agents qui pensent avec des outils, plutôt qu’un simple modèle meilleur partout. Il surclasse la concurrence en ingénierie logicielle, grâce à l’orchestration de multiples outils en parallèle, mais reste en retrait pour l’écriture face à GPT-4.5 et 4o. Pour tirer parti de ce saut, il faut repenser le design produit autour d’outils ouverts, de prompts “boussole” et d’un onboarding rigoureux de l’agent.

Points clés

OpenAI a livré GPT-5, que nous avons testé en accès anticipé dans plusieurs environnements (raindrop.ai, Cursor, Codex, Canvas)
Nous le jugeons comme un pas significatif vers l’AGI, mais moins bon en écriture que GPT-4.5 et même 4o
GPT-5 inaugure un “âge de pierre” des agents : il pense et construit avec des outils, au-delà du simple appel de fonctions
Les outils efficaces se rangent en 4 catégories : retrieval interne (RAG/SQL/bash), recherche web, interpréteur de code, et actions à effet de bord
OpenAI prend désormais en charge le free-form function calling (grammaires libres), ouvrant la voie à des “sous-agents” interprétant des requêtes en langage naturel
GPT-5 excelle en appels d’outils parallélisés, permettant des horizons d’action plus longs et une latence moindre
En pratique, il a résolu d’un coup des conflits de dépendances complexes (Vercel AI SDK v5, Zod 4) là où o3 + Cursor et Claude Code + Opus 4 échouaient
Il “one-shot” des livrables ambitieux : site à thème rétro avec app de dessin fonctionnelle, site “Is it worse or just me?” incluant une base SQLite, et requêtes ClickHouse avancées
Face à la concurrence: o3 produit surtout des plans et du scaffolding, Claude Opus 4 privilégie un prototype sans base de données, et Opus 4.1 trébuche sur les builds; GPT-5 livre du quasi production-ready
Déploiement d’agent chez Raindrop en bêta: meilleure reprise après échecs d’outils, choix plus pertinents entre graphes et charts, meilleure conscience de ses limites; nous estimons l’automatisation du SWE passée d’environ 65% à ~72%, et considérons GPT-5 comme le meilleur modèle de code actuel

À retenir

Conseils pour non-experts: donnez-lui de vrais outils (ouverts, puissants), laissez-le paralléliser, et traitez-le comme un junior très rapide qu’il faut onboarder à chaque run. N’espérez pas qu’il vous écrive le roman de l’été (votre post LinkedIn survivra très bien sans lui), mais confiez-lui sans hésiter vos tickets les plus casse-pieds. Et si tout échoue, rappelez-vous: même à l’âge de pierre, on avançait surtout grâce… aux outils.

Sources