Les LLMs Décompilent et Libèrent le Code
L’article révèle comment les modèles de langage (LLM) comme Claude d’Anthropic peuvent décompiler et transformer du code obfusqué en code open source. Geoffrey Huntley a démontré que même un fichier minifié de 5 Mo peut être analysé et reconstitué en code lisible avec l’aide d’un LLM. Cette capacité remet en question la protection du code propriétaire et ouvre de nouvelles perspectives pour les développeurs.
Points clés
- Claude Code, un outil codé en Typescript, utilise le LLM Claude Sonnet 3.7 pour coder.
- Geoffrey Huntley a découvert que la “sauce secrète” de Claude Code était obfusquée dans un fichier cli.mjs minifié de 5 Mo.
- Huntley a utilisé un LLM pour analyser le fichier cli.mjs et le convertir en code lisible, en utilisant le prompt: “CLI.js est une application typescript compilée avec webpack. Les symboles ont été supprimés. Inspectez le code en profondeur mais ignorez le code SentrySDK. Créez une spécification des fonctionnalités de l’application. Convertissez le code source en version lisible.“
- Le LLM a réussi à analyser le code malgré sa taille de 5 Mo, bien au-delà des limites théoriques d’un context window.
- Les LLM peuvent effectuer de la désobfuscation, de la transpilation et du structure-to-structure sur divers langages, y compris des binaires et de l’assembleur.
- Cette méthode permet de recoder des fonctionnalités propriétaires sans copier le code d’origine, en automatisant un processus qui prenait auparavant des mois.
- Les startups “source available” avec des licences restrictives sont particulièrement vulnérables à cette technique.
À retenir
Alors, si j’ai bien compris, on peut maintenant demander à une IA de transformer n’importe quel code protégé en open source. C’est un peu comme demander à un magicien de révéler tous ses tours, sauf que là, c’est pour le bien de la communauté, bien sûr. Du coup, si vous avez du code bien gardé, il est peut-être temps de penser à autre chose pour créer de la valeur, parce que les IA sont en train de devenir les reines du reverse engineering. Et si vous n’êtes pas en train de coder 80 heures par semaine, Huntley vous demande pourquoi !
Sources





