Yann Le Cun: après le deep learning, les modèles du monde vont propulser l’IA au‑delà de ses limites

EuropeNewsQuantiqueRecherche

Après les LLM, place aux modèles du monde

Au‑delà de la déferlante des LLM, l’IA a besoin de comprendre et de planifier: place aux modèles du monde et aux architectures JPA pour passer du réflexe au raisonnement. Les limites actuelles — absence de mémoire persistante, de compréhension physique et de planification — appellent une nouvelle génération de systèmes apprenants en continu. Dans ce cadre, l’Europe dispose des talents et des équipes pour peser, à condition d’aligner capital, infrastructure et recherche ouverte.

Points clés

  • Yann Le Cun, chief scientist chez Meta, pionnier des réseaux convolutifs, a fondé FAIR en 2013 et a reçu le prix Turing 2018 avec Yoshua Bengio et Geoffrey Hinton
  • Signature annoncée d’un partenariat de 5 ans avec MTA autour de sujets de thèse en IA
  • Les réseaux convolutifs propulsent la vision temps réel (ADAS, imagerie médicale, reconnaissance faciale, drones), tandis que les Transformers dominent le langage
  • Les GPT sont pré‑entraînés en auto‑supervision à prédire le token suivant sur des corpus géants (jusqu’à 10^12–10^13 tokens, soit ~10^14 octets de texte)
  • Limites des LLM actuels: pas de compréhension du monde physique, pas de mémoire persistante, peu de raisonnement et de planification; fort besoin de post‑training et de garde‑fous
  • Un enfant de 4 ans a reçu en vision ~2 Mo/s pendant ~16 000 heures, soit un ordre de grandeur ~10^14 octets — comparable au texte ingéré par les plus grands LLM
  • Prochaine révolution: les modèles du monde et les JPA (joint embedding predictive architecture) pour apprendre des états abstraits, prédire, puis planifier des séquences d’actions
  • Horizon technologique: des idées crédibles fondées sur JPA sous 3–5 ans; des systèmes plus performants que les humains dans la plupart des domaines en 5–20 ans, sans « intelligence générale »
  • Empreinte énergétique: les data centers pèsent aujourd’hui ~2–3 % de l’énergie mondiale; l’inférence sera le principal moteur, d’où les investissements dans le nucléaire et le stockage (hydrogène)
  • L’Europe a les talents: LLaMA est né chez FAIR Paris (une douzaine de chercheurs, majoritairement français; deux co‑fondateurs de Mistral), ~140 personnes à Paris dont ~40 doctorants en résidence; frein principal: l’accès au capital à grande échelle

À retenir

Trois conseils simples avant que vos lunettes IA ne vous répondent à la place: 1) misez sur les bases (maths, physique, méca quantique) — elles survivront à la prochaine mode deep. 2) Ne fétichisez pas les LLM: sans modèle du monde, ils sont brillants… et parfois brillamment à côté. 3) Côté énergie, préférez l’efficacité et les usages utiles: votre modèle n’a pas besoin d’un réacteur pour résumer un e‑mail. Et si vous hésitez entre monter une start‑up ou une librairie Python de plus, souvenez‑vous: les deux se compilent mieux avec un bon doctorat et un peu de capital.

Sources

  • [[Leçon inaugurale] Yann Le Cun – Apprentissage profond et au-delà : les nouveaux défis de l’IA]()

Quiz sur la vidéo: 5 questions