- AISI afirmou que o Mythos Preview da Anthropic e o GPT-5.5 da OpenAI mostraram progresso acima das tendências anteriores em testes de cibersegurança.
- Separadamente, a XBOW divulgou dados sugerindo que modelos de fronteira avançaram na descoberta de vulnerabilidades.
- A Microsoft informou que o MDASH, seu sistema de agentes multi-modelo, foi utilizado para identificar 16 CVEs nas atualizações do Patch Tuesday desta semana.
- O MDASH é apresentado como líder no framework de avaliação de segurança CyberGym.
A Agência de Segurança de IA (AISI) britânica divulgou que modelos de IA avaliados para uso governamental apresentaram avanços notáveis em cibersegurança. Entre eles, Claude Mythos Preview da Anthropic e GPT-5.5 da OpenAI mostraram desempenho acima das tendências anteriores em testes de segurança digital.
A avaliação foi publicada nesta semana pela AISI, que acompanha o ritmo de desenvolvimento de IA autônoma com foco em proteção cibernética. Dados indicam que os modelos continuam a evoluir em detecção e resposta a ameaças, segundo o órgão.
Paralelamente, a XBOW apresentou dados indicando avanços na capacidade de descoberta de vulnerabilidades por modelos de ponta, reforçando o conceito de modelos de fronteira ampliarem o alcance de testes de segurança.
MDASH da Microsoft e resultados em testes
A Microsoft informou que seu conjunto multi-modelo com agência autônoma, chamado MDASH, foi utilizado para identificar 16 CVEs nas atualizações de Patch Tuesday desta semana. A empresa destaca o MDASH como líder no framework de avaliação de segurança CyberGym.
Essa performance coloca MDASH como referência em ambientes de defesa a IA, segundo a própria Microsoft. Entidades de segurança cibernética continuam monitorando como essa abordagem afeta práticas de proteção de sistemas.
Entre na conversa da comunidade