Le 7 avril 2026 marque un tournant dans l’univers de la cybersécurité. Anthropic a levé le voile sur Claude Mythos Preview, un modèle d’intelligence artificielle frontalier aux capacités impressionnantes, capable de débusquer des milliers de vulnérabilités zero-day en un temps record. Pourtant, cette prouesse technologique s’accompagne d’un dilemme majeur : entre exploitation défensive et menace potentielle pour la sécurité publique, l’IA reste enfermée sous clé, accessible uniquement à une poignée d’acteurs triés sur le volet. Ce choix inédit soulève des questions essentielles sur les limites éthiques et sécuritaires de l’IA dans un monde où le digital s’infiltre dans chaque pan de notre quotidien.
Depuis quelques semaines, les tests internes d’Anthropic ont montré que Claude Mythos Preview ne se contente pas de surpasser ses prédécesseurs. Il révèle des failles dans tous les systèmes d’exploitation et navigateurs majeurs – même ceux réputés les plus robustes, comme OpenBSD. Son exploitation met en lumière un paradoxe : alors même que sa puissance pourrait révolutionner la défense contre les cyberattaques, elle pourrait tout aussi bien devenir une arme redoutable si elle tombait entre de mauvaises mains.
Claude Mythos : une intelligence artificielle aux capacités inédites en cybersécurité
Anthropic présente Claude Mythos Preview comme un modèle frontalier capable d’analyses poussées bien au-delà de ce qui est accessible au grand public. Loin d’être entraîné spécifiquement pour la sécurité informatique, ce modèle excelle dans le raisonnement, le codage et l’autonomie. Sur le benchmark SWE-bench Verified, une référence en ingénierie logicielle, Claude Mythos atteint un score impressionnant de 93,9 % contre 80,8 % pour son prédécesseur public Claude Opus 4.6.
Mais c’est dans le domaine de la cybersécurité que le modèle fait la différence:
- 83,1 % sur CyberGym, un test d’identification de vulnérabilités, contre 66,6 % pour Opus 4.6
- 100 % sur Cybench, un ensemble de défis Capture The Flag destiné à simuler des attaques courantes
Ces résultats poussent Anthropic à considérer certains benchmarks désormais obsolètes face à la puissance de Mythos Preview.
Des exploits impressionnants révélant des faiblesses jusque-là ignorées
La capacité d’analyse poussée de Claude Mythos Preview a permis la découverte de failles anciennes, voire historiques. À titre d’exemple, il a repéré un bug vieux de 27 ans dans OpenBSD, un système réputé ultra-sécurisé, et une vulnérabilité de 16 ans dans FFmpeg, une bibliothèque multimédia utilisée par d’innombrables logiciels. Plus inquiétant encore, il a réussi à enchaîner plusieurs failles dans le noyau Linux pour obtenir un contrôle total sur la machine ciblée, démontrant sa capacité à escalader les privilèges sans intervention humaine.
Anthropic rapporte qu’une équipe d’ingénieurs sans formation préalable en sécurité a exploité ce modèle pour trouver, en une seule nuit, une faille d’exécution de code à distance. Cette simplicité d’utilisation laisse entrevoir le risque que des acteurs malveillants puissent se l’approprier, rendant la menace encore plus palpable.
Un risque inédite pour la sécurité publique et nationale
La fuite d’informations sur le projet, fin mars, a suscité un véritable émoi. Dénommé initialement « Capybara », Claude Mythos suscite la crainte d’une weaponisation de l’IA, capable de transformer l’intelligence artificielle en une arme cyber offensive redoutable. Entre nous, cette inquiétude n’est pas sans fondement : les capacités du modèle rendent accessibles à bien plus d’acteurs qu’essentiellement des experts le maniement d’outils de cyberattaque sophistiqués.
Anthropic n’ignore pas les enjeux et insiste sur la nécessité de contrôler la diffusion de cette technologie pour limiter les risques. Des discussions sont en cours avec le gouvernement américain pour évaluer les implications en matière de sécurité nationale et définir des cadres d’utilisation sécurisés.
Project Glasswing : un rempart numérique en réponse
Pour éviter un dérapage, Anthropic a initié Project Glasswing, une initiative qui donne accès à Claude Mythos uniquement à une cinquantaine d’organisations triées sur le volet. Ces acteurs, parmi lesquels figure une liste prestigieuse de partenaires comme AWS, Apple, Microsoft, Google, CrowdStrike, NVIDIA, ainsi que la Linux Foundation, ont pour mission de sécuriser les infrastructures logicielles critiques.
| Partenaires clés de Project Glasswing | Rôle |
|---|---|
| AWS, Apple, Microsoft, Google | Protection d’infrastructures cloud et systèmes d’exploitation |
| CrowdStrike, Linux Foundation, NVIDIA | Cybersécurité, gestion open source, technologies matérielles |
| Une quarantaine d’organisations sectorielles | Maintenance d’infrastructures logicielles critiques |
Avec un financement de plus de 100 millions de dollars en crédits d’utilisation et 4 millions en dons directs à la communauté open source, Anthropic mise sur la collaboration pour encadrer la montée en puissance des IA à haut risque.
Les défis à venir pour encadrer l’intelligence artificielle en cybersécurité
Dans un monde numérique en perpétuelle mutation, il va falloir trouver l’équilibre entre innovation et contrôle. La trajectoire de Claude Mythos Preview démontre que la course à la performance technologique n’est plus une simple bataille commerciale, mais un véritable enjeu de sécurité publique.
Voici les défis majeurs à relever pour les acteurs de l’écosystème digital :
- Développer des garde-fous technologiques permettant de bloquer les usages malveillants sans freiner l’innovation
- Créer des législations et réglementations adaptées pour accompagner le déploiement de l’IA dans la cybersécurité
- Favoriser la coopération internationale pour éviter une prolifération anarchique des outils offensifs
- Former les professionnels et le grand public afin de limiter le risque d’exploitation abusive
- Encourager les initiatives collaboratives comme Project Glasswing pour mutualiser les ressources en sécurité
Anthropic annonce déjà une prochaine étape avec un modèle Claude Opus amélioré, censé intégrer des mécanismes de protection renforcés, mais avec un niveau de risque moindre que Mythos Preview.
Qu’est-ce que Claude Mythos Preview ?
Claude Mythos Preview est un modèle d’intelligence artificielle développé par Anthropic, capable de détecter et exploiter des vulnérabilités informatiques avec une précision et une rapidité inédites.
Pourquoi Anthropic ne rend-il pas ce modèle accessible au public ?
En raison de ses capacités très puissantes pouvant être détournées à des fins malveillantes, l’entreprise a choisi de limiter son accès à un groupe restreint d’organisations de confiance pour des usages défensifs uniquement.
Quels sont les risques associés à cette IA ?
Claude Mythos peut révéler des failles critiques dans des systèmes largement utilisés, ce qui pourrait favoriser la cybercriminalité si elle tombe entre de mauvaises mains.
Qu’est-ce que Project Glasswing ?
C’est une initiative d’Anthropic visant à fournir un accès contrôlé à Claude Mythos à une sélection d’organisations pour renforcer la cybersécurité des infrastructures critiques.
Les capacités de Claude Mythos sont-elles uniques ?
Oui, elles surpassent largement les modèles publics précédents, avec des scores de 100 % sur certains tests de vulnérabilités, ce qui en fait une technologie de pointe dans le domaine.