O chip Jalapeño da OpenAI pode mudar os LLMs para sempre
O chip Jalapeño da OpenAI revoluciona LLMs para sempre.
Conteudo
TLDR;
É o processador de inferência projetado pela OpenAI em parceria com a Broadcom para acelerar e reduzir o custo da execução dos modelos de linguagem. Porque ao controlar o hardware e integrá-lo aos seus modelos a OpenAI pode aumentar velocidade e eficiência por watt, reduzindo latência e custos de inferência. A amostra foi anunciada em 24 de junho de 2026 e servidores com Jalapeño são esperados até o fim de 2026, mas benchmarks independentes e o relatório técnico completo ainda não foram publicados.
Resumo
OpenAI deu um passo inédito ao projetar, em parceria com a Broadcom, seu próprio chip de inferência chamado Jalapeño, entregue simbolicamente aos executivos da empresa; o objetivo é acelerar e baratear a etapa em que modelos como o ChatGPT geram respostas, enfrentando o aumento de latência provocado pelos chamados modelos de raciocínio (que geram milhares de tokens internos) e por fluxos agentivos que amplificam esse atraso. A empresa afirma que o Jalapeño oferece desempenho por watt superior aos melhores chips atuais e que passou da primeira versão ao tape‑out em apenas nove meses, usando inclusive seus próprios modelos de IA para otimizar o projeto — embora números de benchmark completos ainda não tenham sido publicados. Broadcom cuidou da engenharia de silício e da interconexão; Celestica e a TSMC participaram da montagem e fabricação; e a meta é integrar esse hardware à pilha completa da OpenAI para reduzir custos (Bloomberg sugere cerca de 50% de economia) e escalar até gigawatts com parceiros como a Microsoft, iniciando servidores até o fim de 2026 e planejando várias gerações de chips, o que pode revolucionar a velocidade, o custo e a confiabilidade do uso de LLMs e ampliar inovação em aplicações de inteligência artificial.