Inteligencia Artificial

Los investigadores de ciberseguridad no están contentos con las restricciones en Fable de Anthropic

Redaccion NEO·10/6/2026

Anthropic lanzó su último modelo Fable el martes, presentándolo como una versión pública y limitada de su poderoso y muy promocionado modelo de ciberseguridad Mythos.

Pero no todos están felices con las restricciones, y varios investigadores y profesionales de ciberseguridad han expresado sus quejas en línea.

"[Fable] rechaza cualquier solicitud que pueda estar tangencialmente relacionada con ciberseguridad. Incluso tareas inofensivas como leer un artículo de blog", dijo Valentina "Chompie" Palmiotti, una conocida investigadora de seguridad que trabaja en IBM X-Force.

Cuando un prompt activa sus guardarraíles, Fable pausa el chat y dice que sus "medidas de seguridad marcaron este mensaje por temas de ciberseguridad o biología".

Los guardarraíles fueron implementados para limitar el riesgo de que Fable pudiera usarse para desarrollar malware o comprometer software, una preocupación histórica dentro de Anthropic. Las restricciones sobre biología provienen de una preocupación similar sobre el desarrollo de armas biológicas.

Cuando el gigante de IA lanzó Mythos en abril, restringió el modelo a un número limitado de empresas y organizaciones en lo que llamó Proyecto Glasswing, un esfuerzo para implementar el modelo para asegurar software e infraestructura crítica. La semana pasada, Anthropic expandió el acceso a Mythos a cientos de organizaciones en 15 países.

Pero a pesar de las buenas intenciones, muchos expertos en ciberseguridad siguen molestos por la naturaleza errática de las restricciones. Matt Suiche, un veterano en ciberseguridad, le dijo a TechCrunch que "si le pides que escriba código seguro, asume que es trabajo relacionado con ciberseguridad en lugar de prácticas recomendadas de ingeniería de software, y te degradas". Fable está programado para recurrir a Claude Opus 4.8 si se activa un guardarraíl. "Parece estar basado en palabras clave, así que cualquier cosa en el campo léxico de 'ciberseguridad' activa los guardarraíles".

Contactos ¿Tienes más información sobre cómo los hackers están utilizando IA? ¿O cómo las empresas de ciberseguridad están utilizando IA? Nos encantaría saber de ti. Desde un dispositivo y red sin conexión laboral, puedes contactar a Lorenzo Franceschi-Bicchierai de forma segura en Signal al +1 917 257 1382, o a través de Telegram y Keybase @lorenzofb, o por correo electrónico.

"Pero es comprensible ya que aún estamos en los primeros días y todavía están adaptando sus guardarraíles. Estoy seguro de que evolucionarán con el tiempo a medida que Anthropic y otras empresas de modelos fronterizos colaboren más con la nueva generación actual de empresas de ciberseguridad", dijo Suiche, quien es miembro del personal técnico en Tolmo, una startup de ciberseguridad de IA. "Es mejor captar a más personas que no suficientes cuando haces un lanzamiento así y relajar los guardarraíles con el tiempo".

Otro investigador se quejó en X que "incluso pedir una revisión de código" activa los guardarraíles de Fable.

Anthropicno respondió de inmediato.