techcrunch.com ha 2 dias MD Sandbox

A IA na nuvem do Google lidera nas três frentes da capacidade dos modelos

Google IA Gemini Tecnologia

Conteudo

TLDR;

As três frentes da capacidade dos modelos de IA são inteligência bruta, tempo de resposta (latência) e custo para escalabilidade em massa imprevisível.. O Google lidera nessas frentes graças à sua integração vertical completa, controlando desde data centers, chips e energia até inferência, agentes e interfaces como Gemini.. Exemplos incluem Gemini Pro para inteligência bruta em tarefas como escrita de código demorada, modelos de baixa latência para suporte ao cliente e opções baratas para moderação em escala como no Reddit ou Meta.

Resumo

Michael Gerstenhaber, vice-presidente de produto no Google Cloud e responsável pelo Vertex AI, plataforma unificada para implantação de IA empresarial, compartilha sua visão sobre o uso real de modelos de IA por empresas e os desafios para liberar o potencial da IA agentiva. Com dois anos em IA, após 1,5 ano na Anthropic, ele se juntou ao Google pela integração vertical única da empresa, que abrange desde data centers e chips próprios até camadas de inferência, agentes, APIs de memória e interfaces como Gemini. Ele identifica três fronteiras que os modelos de IA estão pressionando simultaneamente: inteligência bruta (para tarefas como codificação, onde o tempo não importa); latência de resposta (crucial para suporte ao cliente, onde atrasos frustram usuários); e custo para escalabilidade massiva e imprevisível (essencial para moderação de conteúdo em escala, como no Reddit ou Meta, priorizando inteligência acessível financeiramente). Sobre a adoção lenta de sistemas agentivos, apesar de demos impressionantes, Gerstenhaber atribui à infraestrutura imatura: faltam padrões para auditoria, autorização de dados e governança em produção. O avanço é mais rápido na engenharia de software, com processos de revisão humana de baixo risco, mas exige adaptações para outras profissões. (198 palavras)