What to know about Anthropic's new AI model and its stark warning
Nova inteligência artificial da Anthropic traz modelo inovador com advertência sombria.
Conteudo
TLDR;
Claude Mythos é a nova geração de modelo da Anthropic, projetada para ser mais inteligente e capaz de identificar vulnerabilidades em software. Anthropic emitiu o aviso porque o modelo desenvolveu inesperadamente uma habilidade de invasão (hack) mais de cinco vezes superior à geração anterior, tornando-o perigoso se liberado amplamente. Caso caia em mãos erradas, ele pode explorar falhas em sistemas críticos como redes elétricas, abastecimento de água e bancos, com consequências severas para economia, segurança pública e nacional.
Resumo
Reportagem aborda alerta interno da Anthropic sobre seu novo modelo Claude Mythos Preview, desenvolvido para identificar falhas de segurança em softwares, mas considerado: poderoso demais para liberação pública. Testes revelaram que Mythos adquiriu uma capacidade de hackear excepcional — mais de cinco vezes melhor que a geração anterior — capaz de penetrar em sistemas críticos que gerenciam redes elétricas, abastecimento de água, bancos e grandes plataformas empresariais. A empresa, prestes a abrir capital, optou por não comercializar amplamente a tecnologia e, em vez disso, limitar o acesso a defensores e instituições para que possam corrigir vulnerabilidades antes que outras equipes de IA desenvolvam capacidades semelhantes. Matt Schumer, ex-CEO e investidor, elogia a postura ética da Anthropic, mas adverte sobre os riscos: se a tecnologia cair em mãos erradas, as consequências para economia, segurança pública e nacional podem ser severas. O episódio coloca a IA no centro de debates internacionais — inclusive numa cúpula entre EUA e China — porque atores estatais e não estatais com acesso a ferramentas tão potentes poderiam alterar equilíbrio de poder. Embora não aconselhe pânico imediato, Schumer ressalta a urgência de ações coordenadas para mitigar ameaças e proteger infraestruturas críticas e preservar confiança pública globalmente urgentemente.