Voxtral : l’IA audio open source de Mistral
Mistral, la startup française d’IA, a dévoilé Voxtral, sa première famille de modèles audio open source. Cette initiative vise à démocratiser l’accès à une intelligence vocale performante pour les entreprises, offrant une alternative abordable et flexible aux solutions propriétaires. Voxtral promet de transformer la manière dont les machines interagissent avec la parole, en combinant transcription de haute qualité et compréhension sémantique avancée.
Points clés
- Mistral a annoncé le lancement de Voxtral, sa première famille de modèles audio open source.
- Voxtral est présenté comme le premier modèle ouvert capable de déployer une “intelligence vocale véritablement utilisable en production”.
- Ce modèle offre une alternative abordable, coûtant “moins de la moitié du prix” des solutions comparables.
- Voxtral peut transcrire jusqu’à 30 minutes d’audio et comprendre jusqu’à 40 minutes grâce à son architecture LLM, Mistral Small 3.1.
- Il permet aux utilisateurs de poser des questions sur le contenu audio, de générer des résumés et de traduire des commandes vocales en actions.
- Voxtral est multilingue et prend en charge l’anglais, l’espagnol, le français, le portugais, l’hindi, l’allemand, le néerlandais et l’italien.
- Deux variantes sont disponibles : Voxtral Small (24 milliards de paramètres) pour les déploiements à l’échelle de la production, compétitif avec ElevenLabs Scribe, GPT-4o-mini et Gemini 2.5 Flash.
- La seconde variante, Voxtral Mini (3 milliards de paramètres), est conçue pour les déploiements locaux et en périphérie.
- Une version API ultra-économique, Voxtral Mini Transcribe, est optimisée pour la transcription seule et surpasse OpenAI Whisper pour moins de la moitié du prix.
- L’intégration de l’API coûte 0,001 $ par minute, et les modèles peuvent être testés gratuitement via Hugging Face ou le chatbot Le Chat de Mistral.
À retenir
Alors, chers développeurs et entreprises, réjouissez-vous ! Mistral vous offre enfin la liberté de ne plus choisir entre un système open source qui baragouine et une solution propriétaire qui vous coûte un bras. Avec Voxtral, vous pourrez désormais faire parler vos machines avec une clarté et une intelligence déconcertantes, le tout sans vider votre portefeuille. C’est presque comme si l’IA devenait enfin… sensée ? Qui l’eût cru !
Sources





