Deepseek r1 : un concurrent sérieux pour openai ?
Le laboratoire chinois deepseek a lancé deepseek-r1, une famille de modèles d’ia open source, sous licence mit, rivalisant avec le modèle o1 d’openai en termes de performances de raisonnement. deepseek-r1, avec jusqu’à 671 milliards de paramètres, surpasse o1 sur des benchmarks spécifiques comme aime, math-500 et swe-bench verified. cette avancée marque un tournant potentiel dans l’accessibilité et l’utilisation commerciale des modèles d’ia performants.
Points clés
- deepseek a publié deepseek-r1, un modèle de raisonnement open source sous licence mit, affirmant qu’il rivalise avec le modèle o1 d’openai.
- deepseek-r1 bat o1 sur les benchmarks aime, math-500 et swe-bench verified.
- le modèle deepseek-r1 comprend une version avec 671 milliards de paramètres.
- deepseek a également publié six versions plus petites de deepseek-r1-distill, allant de 1,5 milliard à 70 milliards de paramètres.
- simon willison, chercheur indépendant en ia, a testé l’un des plus petits modèles et a noté sa capacité à produire un raisonnement interne approfondi.
- deepseek-r1-zero a été formé par apprentissage par renforcement à grande échelle (rl) sans réglage fin supervisé (sft).
- deepseek-r1 incorpore des données de départ à froid avant le rl pour améliorer les performances de raisonnement.
- les modèles distillés sont basés sur des architectures open source existantes telles que qwen et llama.
À retenir
Alors, deepseek vient-il vraiment chatouiller openai ? Il semble que oui, avec un modèle open source qui ose se mesurer aux géants. On dirait que l’ia devient de plus en plus accessible, même si on ne comprend toujours pas comment ces machines font pour “raisonner”. Bientôt, ils nous demanderont notre avis sur la métaphysique, et là, on sera bien embêtés !
Sources





