Nouveau modèle d’IA pour des vidéos physiques

Nvidia a récemment dévoilé sa propre gamme de modèles du monde, appelés Cosmos World Foundation Models, lors du CES 2025 à Las Vegas. Ces modèles d’IA, accessibles via des API et des plateformes comme Hugging Face, permettent de générer des vidéos “sensibles à la physique”, avec des applications variées allant de la simulation à la génération de données synthétiques. En rendant ces modèles disponibles sous une licence permissive, Nvidia vise à démocratiser l’accès à ces outils puissants pour les chercheurs et développeurs.

Points clés

  • Nvidia a lancé les Cosmos World Foundation Models lors du CES 2025.
  • Ces modèles peuvent prédire et générer des vidéos “sensibles à la physique”.
  • Les modèles sont disponibles via les API de Nvidia, NGC et Hugging Face.
  • Les Cosmos WFM sont divisés en trois catégories : Nano, Super et Ultra.
  • Les modèles ont été entraînés sur 9 000 trillions de tokens provenant de 20 millions d’heures d’interactions humaines.
  • Nvidia affirme que les modèles peuvent générer des données synthétiques de haute qualité pour des applications comme les véhicules autonomes.
  • Des entreprises comme Waabi, Wayve, Foretellix et Uber ont déjà prévu d’utiliser les Cosmos WFM.
  • Nvidia a été accusé d’utiliser des vidéos YouTube sous copyright pour entraîner ses modèles.
  • Les Cosmos WFM ne sont pas “open source” au sens strict, mais sont qualifiés de “ouverts”.
  • Jensen Huang, CEO de Nvidia, espère que Cosmos transformera le domaine de l’IA industrielle comme Llama l’a fait pour l’entreprise.

À retenir

Alors, si vous êtes un développeur en quête de modèles d’IA pour vos projets, n’hésitez pas à plonger dans le monde des Cosmos de Nvidia. Après tout, qui n’aime pas un peu de magie numérique pour améliorer ses simulations ? Mais attention, ne vous attendez pas à ce que ces modèles fassent tout le travail à votre place, ils ne sont pas encore prêts à prendre votre café le matin !

Sources