Après les LLM, place aux modèles du monde
Au‑delà de la déferlante des LLM, l’IA a besoin de comprendre et de planifier: place aux modèles du monde et aux architectures JPA pour passer du réflexe au raisonnement. Les limites actuelles — absence de mémoire persistante, de compréhension physique et de planification — appellent une nouvelle génération de systèmes apprenants en continu. Dans ce cadre, l’Europe dispose des talents et des équipes pour peser, à condition d’aligner capital, infrastructure et recherche ouverte.
Points clés
- Yann Le Cun, chief scientist chez Meta, pionnier des réseaux convolutifs, a fondé FAIR en 2013 et a reçu le prix Turing 2018 avec Yoshua Bengio et Geoffrey Hinton
- Signature annoncée d’un partenariat de 5 ans avec MTA autour de sujets de thèse en IA
- Les réseaux convolutifs propulsent la vision temps réel (ADAS, imagerie médicale, reconnaissance faciale, drones), tandis que les Transformers dominent le langage
- Les GPT sont pré‑entraînés en auto‑supervision à prédire le token suivant sur des corpus géants (jusqu’à 10^12–10^13 tokens, soit ~10^14 octets de texte)
- Limites des LLM actuels: pas de compréhension du monde physique, pas de mémoire persistante, peu de raisonnement et de planification; fort besoin de post‑training et de garde‑fous
- Un enfant de 4 ans a reçu en vision ~2 Mo/s pendant ~16 000 heures, soit un ordre de grandeur ~10^14 octets — comparable au texte ingéré par les plus grands LLM
- Prochaine révolution: les modèles du monde et les JPA (joint embedding predictive architecture) pour apprendre des états abstraits, prédire, puis planifier des séquences d’actions
- Horizon technologique: des idées crédibles fondées sur JPA sous 3–5 ans; des systèmes plus performants que les humains dans la plupart des domaines en 5–20 ans, sans « intelligence générale »
- Empreinte énergétique: les data centers pèsent aujourd’hui ~2–3 % de l’énergie mondiale; l’inférence sera le principal moteur, d’où les investissements dans le nucléaire et le stockage (hydrogène)
- L’Europe a les talents: LLaMA est né chez FAIR Paris (une douzaine de chercheurs, majoritairement français; deux co‑fondateurs de Mistral), ~140 personnes à Paris dont ~40 doctorants en résidence; frein principal: l’accès au capital à grande échelle
À retenir
Trois conseils simples avant que vos lunettes IA ne vous répondent à la place: 1) misez sur les bases (maths, physique, méca quantique) — elles survivront à la prochaine mode deep. 2) Ne fétichisez pas les LLM: sans modèle du monde, ils sont brillants… et parfois brillamment à côté. 3) Côté énergie, préférez l’efficacité et les usages utiles: votre modèle n’a pas besoin d’un réacteur pour résumer un e‑mail. Et si vous hésitez entre monter une start‑up ou une librairie Python de plus, souvenez‑vous: les deux se compilent mieux avec un bon doctorat et un peu de capital.
Sources
- [[Leçon inaugurale] Yann Le Cun – Apprentissage profond et au-delà : les nouveaux défis de l’IA]()
Quiz sur la vidéo: 5 questions




