Nouveau modèle d’IA pour des vidéos physiques
Nvidia a récemment dévoilé sa propre gamme de modèles du monde, appelés Cosmos World Foundation Models, lors du CES 2025 à Las Vegas. Ces modèles d’IA, accessibles via des API et des plateformes comme Hugging Face, permettent de générer des vidéos “sensibles à la physique”, avec des applications variées allant de la simulation à la génération de données synthétiques. En rendant ces modèles disponibles sous une licence permissive, Nvidia vise à démocratiser l’accès à ces outils puissants pour les chercheurs et développeurs.
Points clés
- Nvidia a lancé les Cosmos World Foundation Models lors du CES 2025.
- Ces modèles peuvent prédire et générer des vidéos “sensibles à la physique”.
- Les modèles sont disponibles via les API de Nvidia, NGC et Hugging Face.
- Les Cosmos WFM sont divisés en trois catégories : Nano, Super et Ultra.
- Les modèles ont été entraînés sur 9 000 trillions de tokens provenant de 20 millions d’heures d’interactions humaines.
- Nvidia affirme que les modèles peuvent générer des données synthétiques de haute qualité pour des applications comme les véhicules autonomes.
- Des entreprises comme Waabi, Wayve, Foretellix et Uber ont déjà prévu d’utiliser les Cosmos WFM.
- Nvidia a été accusé d’utiliser des vidéos YouTube sous copyright pour entraîner ses modèles.
- Les Cosmos WFM ne sont pas “open source” au sens strict, mais sont qualifiés de “ouverts”.
- Jensen Huang, CEO de Nvidia, espère que Cosmos transformera le domaine de l’IA industrielle comme Llama l’a fait pour l’entreprise.
À retenir
Alors, si vous êtes un développeur en quête de modèles d’IA pour vos projets, n’hésitez pas à plonger dans le monde des Cosmos de Nvidia. Après tout, qui n’aime pas un peu de magie numérique pour améliorer ses simulations ? Mais attention, ne vous attendez pas à ce que ces modèles fassent tout le travail à votre place, ils ne sont pas encore prêts à prendre votre café le matin !
Sources





