Ciberseguridad4 min

¿Nuevo modelo de IA de Anthropic con 'riesgos de ciberseguridad sin precedentes'? La filtración más irónica

Escuchar
Compartir

Una filtración de datos expuso el próximo modelo de Anthropic, 'Claude Mythos', que promete avances significativos pero también 'riesgos de ciberseguridad sin precedentes'.

OMNI
OMNI
#Anthropic#IA#Ciberseguridad#Claude Mythos#Filtración
¿Nuevo modelo de IA de Anthropic con 'riesgos de ciberseguridad sin precedentes'? La filtración más irónica
En medio de la creciente competencia en el campo de la inteligencia artificial, Anthropic se encuentra trabajando en un nuevo modelo de IA llamado 'Claude Mythos'. Este modelo, según un portavoz de la compañía, representa un 'cambio radical' en las capacidades de la IA y es el 'más capaz que hemos construido hasta la fecha'. Se describe como un modelo de propósito general con avances significativos en razonamiento, codificación y ciberseguridad.

La noticia de este desarrollo llega en un momento crucial, donde las empresas siguen invirtiendo grandes sumas de dinero en el desarrollo de modelos de IA, y la carrera por la supremacía tecnológica no muestra signos de desaceleración. Este nuevo modelo podría marcar un hito en la evolución de la IA, pero también plantea interrogantes sobre su impacto en la seguridad digital.
La ironía de la situación es notable: una filtración de datos, causada por una importante falla de seguridad en el sistema de gestión de contenidos de Anthropic, reveló detalles sobre 'Claude Mythos'. Un borrador de blog obtenido por Fortune, que estaba 'disponible en un almacén de datos no seguro y de búsqueda pública', afirmaba que el nuevo modelo 'plantea riesgos de ciberseguridad sin precedentes'.

Este incidente pone a prueba a la compañía, que ha recibido mucha atención mediática por sus herramientas Claude Code y Claude Cowork. La filtración también reveló una 'nueva categoría' de modelos de IA, denominada Capybara, de la cual Mythos parece formar parte, pero aún no está claro cómo encaja Capybara con las categorías existentes de Anthropic: Opus, Sonnet y Haiku.
Según la filtración, 'en comparación con nuestro mejor modelo anterior, Claude Opus 4.6, Capybara obtiene puntuaciones significativamente más altas en pruebas de codificación de software, razonamiento académico y ciberseguridad, entre otras'. Sin embargo, la compañía advierte que, aunque el modelo podría obtener mejores resultados en las pruebas de ciberseguridad, podría representar un desafío importante para las defensas de ciberseguridad existentes.

Anthropic ha expresado su intención de actuar con cautela y comprender los riesgos que plantea el modelo, incluso más allá de sus propias pruebas. La compañía busca entender los riesgos a corto plazo del modelo en el ámbito de la ciberseguridad y compartir los resultados para ayudar a los defensores cibernéticos a prepararse.
Los riesgos parecen ser lo suficientemente reales como para que las acciones de ciberseguridad se desplomaran el viernes después de las últimas noticias. Anthropic admitió previamente que los hackers utilizaron su modelo Claude AI para automatizar ciberdelitos dirigidos a bancos y gobiernos. Según la publicación del blog de la compañía en noviembre, un grupo patrocinado por el estado chino explotó las capacidades de agente de la IA para infiltrarse en 'aproximadamente treinta objetivos globales y tuvo éxito en un pequeño número de casos' al 'fingir trabajar para organizaciones legítimas de pruebas de seguridad' para eludir las barreras de protección de IA de Anthropic.

Este historial de incidentes plantea serias dudas sobre la seguridad de los modelos de IA y su potencial para ser utilizados con fines maliciosos.
El anuncio de un modelo de IA 'revolucionario' es algo común en la industria, pero queda por ver si 'Claude Mythos' cumplirá las expectativas. OpenAI, por ejemplo, decepcionó en agosto con su modelo GPT-5, que no cumplió las promesas de la compañía.

La situación actual resalta la complejidad y los desafíos inherentes al desarrollo de la IA, así como la necesidad de una gestión de riesgos rigurosa y una transparencia total en el proceso. La industria de la ciberseguridad y los usuarios finales, esperan ansiosamente más detalles sobre 'Claude Mythos' y su impacto en el futuro digital.
Historias Relacionadas