- Diretriz de controle de exportação obrigou bloquear o acesso de todos os estrangeiros aos serviços Fable 5 e Mythos 5.
- Anthropic afirmou estar cumprindo a ordem, mas o governo não forneceu detalhes específicos da preocupação de segurança nacional.
- A empresa diz que evidências de possível jailbreak foram comunicadas verbalmente e que as vulnerabilidades encontradas são pequenas e acessíveis em outros modelos, incluindo GPT 5.5.
- Ações tomadas incluíram cooperação com governos dos Estados Unidos e do Reino Unido e a alteração da política de retenção de dados para monitorar tentativas de uso indevido.
- A empresa afirma não ter recebido divulgação de qualquer jailbreak não universal que tenha gerado resultado nocivo; o que foi descrito é benigno ou sem ganho específico para Mythos.
A Anthropic interrompeu o acesso aos modelos Fable 5 e Mythos 5 após uma ordem de controle de exportação, citando preocupações de segurança nacional. A medida exigiu bloquear o acesso de todos os nacionais estrangeiros. A empresa afirmou estar cumprindo a diretriz, mas afirmou que o governo não forneceu detalhes específicos de suas preocupações de segurança.
Segundo a declaração da empresa, não houve divulgação de um potencial jailbreak que levasse a resultados nocivos. As falhas alegadas teriam sido comunicadas verbalmente, e os problemas identificados seriam marginais, já estando disponíveis em outros modelos, incluindo o GPT 5.5. A Anthropic descreve uma avaliação de risco que não aponta vulnerabilidades específicas que elevem o risco Mythos.
Medidas de proteção e cooperação governamental
A companhia detalha ações para salvaguardar Fable e Mythos, incluindo cooperação com governos dos EUA e do Reino Unido. Além disso, houve a atualização da política de retenção de dados para monitorar tentativas de uso indevido dos modelos.
A empresa reforça que as informações recebidas sobre potenciais falhas não indicam riscos significativos exclusivos aos seus modelos Mythos. Em linhas gerais, a avaliacao interna sugere que as vulnerabilidades descritas são de baixo impacto ou podem ser replicadas em plataformas alternativas.
Entre na conversa da comunidade