Anthropic ha anunciado el lanzamiento del Proyecto Glasswing, una iniciativa sectorial diseñada para aprovechar un nuevo modelo de IA aún no publicado con el fin de fortalecer la infraestructura de software crítica. El proyecto reúne a una coalición de grandes empresas tecnológicas, entre ellas Google, Microsoft, Amazon Web Services, Apple, Nvidia y Cisco, para abordar los riesgos que plantean los sistemas de IA cada vez más capaces.
El núcleo de esta iniciativa es Claude Mythos Preview, un modelo de frontera de propósito general que, según Anthropic, está restringido actualmente a socios de "seguridad defensiva". De acuerdo con la empresa, las "sólidas capacidades de codificación y razonamiento autónomo" del modelo le permitieron identificar miles de vulnerabilidades de alta gravedad en todos los sistemas operativos y navegadores web importantes en las últimas semanas. Anthropic señaló que el modelo detectó estos fallos y desarrolló los exploits correspondientes "de forma totalmente autónoma, sin intervención humana".
Newton Cheng, líder de ciberseguridad del equipo de pruebas de intrusión de Anthropic, afirmó que el objetivo del modelo es dar a los defensores una "ventaja inicial" frente a los adversarios. La empresa ha decidido no publicar Mythos Preview al público debido a importantes preocupaciones de seguridad. El acceso está limitado actualmente a los socios del proyecto, entre los que se incluyen JPMorgan Chase, Broadcom, CrowdStrike, la Linux Foundation y Palo Alto Networks, además de otras 40 organizaciones aproximadamente.
Un punto de inflexión para la seguridad
En una entrada de blog técnica, el equipo de investigación de Anthropic describió el rendimiento del modelo como un "punto de inflexión para la seguridad". El equipo informó que Mythos Preview es capaz de encontrar y explotar vulnerabilidades de día cero en bases de código de código abierto y realizar ingeniería inversa de exploits en software de código cerrado. Aunque los investigadores señalaron que más del 99% de las vulnerabilidades identificadas durante sus pruebas permanecen sin parchear, destacaron que el 1% que pueden discutir demuestra un "salto sustancial" en las capacidades de la IA.
A pesar del alto rendimiento del modelo, su debut se produce tras una reciente filtración de datos. Dianne Penn, jefa de gestión de productos en Anthropic, declaró a The Verge que la filtración se debió a un error humano y "no estuvo relacionada en absoluto con vulnerabilidades de software". Añadió que la empresa está "tomando medidas para consolidar nuestros procesos".
Para apoyar la iniciativa, Anthropic ha comprometido hasta 100 millones de dólares en créditos de uso para Mythos Preview. La empresa también está realizando donaciones directas por valor de 4 millones de dólares a la Linux Foundation y a la Apache Software Foundation. Cheng afirmó que, aunque Anthropic está subvencionando estos costes, el objetivo a largo plazo es preparar a la industria en general para un panorama en el que los ciberataques impulsados por IA sean cada vez más frecuentes y sofisticados. Anthropic sostiene que, dado que el progreso de la IA avanza rápidamente, es necesaria una acción defensiva colaborativa para garantizar que las medidas de seguridad superen la capacidad de los actores malintencionados para explotar estos sistemas.