14:09
youtube.com ha 4 dias SRT AI Videos

Anthropic killed Tool calling

Por AI Jason

Anthropic Tecnologia LLM Programação

Conteudo

TLDR;

A Anthropic lançou o "programmatic tool calling" como uma evolução do tool calling tradicional, permitindo que o modelo gere código para chamar múltiplas ferramentas de forma eficiente e determinística, reduzindo o desperdício de tokens.. O tool calling antigo é ineficiente para tarefas complexas, pois depende do modelo para regenerar parâmetros repetidamente e acumula dados desnecessários no contexto, limitando agentes em tarefas longas.. No programmatic tool calling, basta adicionar a função de code execution com allowed_caller nas ferramentas, permitindo que o modelo execute código com loops e condicionais para workflows avançados sem reestruturar o agente.

Resumo

O vídeo discute atualizações da Anthropic em tool calling, considerado uma evolução para 2.0, essencial para agentes de IA em tarefas longas e complexas. Tradicionalmente, o tool calling permite que modelos de linguagem grande (LLMs) gerem JSON para invocar funções ou APIs, transformando texto puro em ações reais, como consultar o clima em Paris. No entanto, para tarefas multifuncionais, como buscar e-mails no Gmail ou pesquisar notícias na web para um blog, o processo é ineficiente: exige múltiplas chamadas sequenciais, desperdiça tokens no contexto (devido a metadados desnecessários e recriações manuais de parâmetros), gera comportamentos não determinísticos e consome janelas de contexto limitadas (efetivamente 120-200k tokens). A Anthropic introduz melhorias, destacando o "programmatic tool calling", inspirado em papers como "executable code actions" e "code mode" da Cloudflare. Agora, o LLM gera código executável em um sandbox (via função code_execution), acessando ferramentas diretamente com loops, condicionais e passagem eficiente de resultados, reduzindo drasticamente o uso de tokens e melhorando a performance — testes mostram o o1-preview resolvendo puzzles mais avançados. A implementação é simples: adicionar o code_execution como allowed_caller nas ferramentas existentes, ativando fluxos automáticos para workflows complexos, como consultas de banco de dados com agregações. (198 palavras)