8:52
youtube.com ha 3 dias SRT AI Videos

Fugu Ultra: A Model That Beats Mythos and Fable? This Can't Be True...

Fugu Ultra: modelo que supera Mythos e Fable?

Modelos de IA Tecnologia Orquestração Anthropic

Conteudo

TLDR;

Fugo Ultra é um orquestrador treinado de cerca de 7 bilhões de parâmetros que seleciona, divide e combina outros modelos para entregar um único resultado, e a Sakana afirma que seus scores em benchmarks públicos se equiparam aos do Mythos e Fable. As alegações de que “bate” Mythos e Fable baseiam‑se apenas nos resultados reportados pela própria Sakana e ainda não foram verificadas por testes independentes. O preço anunciado é cerca de $5 por milhão de tokens de entrada e $30 por milhão de tokens de saída, com planos de $20–$200/mês, mas o serviço está bloqueado na UE por regras de privacidade e a informação sobre quais modelos foram usados fica propositalmente oculta.

Resumo

Há cerca de dez dias a Anthropic teve de retirar o acesso público aos modelos Mythos e Fable 5 por ordem de controle de exportação dos EUA; em resposta, o laboratório japonês Sakana lançou o Fugo, um orquestrador de modelos de ~7 bilhões de parâmetros que decide quais modelos terceirizados executar cada parte de um pedido, divide tarefas, checa respostas e devolve um único resultado, estratégia chamada pela empresa de "orquestração" ou "soberania de IA". Fundadores experientes (David Ha, Llion Jones) dizem ter treinamento real de roteamento e publicaram pesquisas sobre isso. Há duas versões: Fugo (rápido) e Fugo Ultra (para trabalhos pesados como pesquisa e análise de segurança). Benchmarks internos mostram desempenho semelhante a Fable/Mythos e superior a alguns concorrentes em testes como Live Code Bench e GPQA Diamond, mas sem verificação externa. O serviço é bloqueado na UE por questões de privacidade e oculta quais modelos efetivamente usa; preços variam e Fugo Ultra cobra por tokens (mais caro em alguns casos), gerando críticas mistas: gerações mostram vantagens em tarefas como renderização 3D e economia de tempo, porém resultados e custos variam conforme prompt e modelo selecionado, sem garantia de superioridade consistente, e avaliação independente é necessária para segurança.