L’empreinte réelle d’un LLM, chiffres à l’appui

En publiant une analyse de cycle de vie complète de son modèle Large 2, Mistral AI met des chiffres concrets sur l’empreinte carbone, hydrique et matérielle des LLM. Les phases d’entraînement et d’inférence dominent l’impact, avec un total de 20,4 kilotonnes de CO₂ et 281 000 m³ d’eau consommés en 18 mois, malgré un coût marginal par requête relativement faible. L’entreprise appelle à plus de transparence sectorielle et prévoit des mises à jour régulières pour aligner l’IA sur les objectifs climatiques.

Points clés

  • Mistral AI publie une analyse de cycle de vie de son modèle Large 2 afin de quantifier son impact environnemental
  • L’étude a été menée avec Carbone 4 et l’agence française de la transition écologique, et relue par Resilio et Hubblo
  • Portée méthodologique: émissions de gaz à effet de serre, usage et raréfaction de l’eau, et consommation de matériaux sur l’ensemble du cycle de vie
  • Phases les plus impactantes: entraînement et inférence, responsables de 85,5 % des émissions de GES et de 91 % de la consommation d’eau
  • Bilan cumulé au 01/2025 (18 mois d’exploitation): 20,4 kilotonnes de CO₂ émises
  • Consommation d’eau totale sur la même période: 281 000 m³
  • Impact marginal par requête: une réponse de 400 tokens via le chatbot « Le Chat » émet 1,14 g de CO₂ et consomme 45 ml d’eau
  • Équivalence indicative: environ 10 secondes de vidéo en streaming aux États‑Unis pour une requête
  • Limites reconnues: quantification difficile de l’usure matérielle des GPU et de l’infrastructure des centres de données
  • Suite annoncée: rapports actualisés et appel à une transparence accrue pour aligner l’IA avec les objectifs climatiques, malgré un contexte politique américain peu favorable

À retenir

Traduction pour non-initiés: évitez de « spammer » les prompts, privilégiez des modèles plus petits quand c’est suffisant, et demandez à vos fournisseurs des chiffres clairs (car oui, la planète aime les KPI). Optez pour des services alimentés aux renouvelables, limitez la longueur des réponses, activez le cache et regroupez les tâches pour réduire l’inférence répétitive. Un prompt de moins ne sauvera pas la banquise à lui seul, mais des millions, ça commence à causer — et votre facture d’électricité vous dira merci.

Sources