82 Centavos de Cada Dólar de IA Nunca Entregam, e o Spotify Mostra Por Quê

Aqui está um número que devia reformular toda conversa de orçamento de IA. Para cada dólar que uma empresa gasta em desenvolvimento assistido por IA, só 18 centavos chegam à produção como produto entregue. Os outros 82 centavos se dissolvem em correção de bugs, reescritas e ciclos de revisão. Esse número vem da EntelligenceAI, trazido pelo Wall Street Journal e discutido no artigo de junho da Big Technology sobre o acerto de contas dos tokens. Trate como direcional, não auditado. Mas a direção é o ponto. A maior parte do gasto com IA não compra entrega. Compra retrabalho.

O reflexo é culpar os modelos. Se 82 centavos morrem na revisão, os agentes devem ser fracos demais, o raciocínio raso demais, as alucinações frequentes demais. Esse reflexo está errado, e uma empresa prova isso. O Spotify roda os mesmos agentes, no mesmo nível de modelo que todo mundo, e os agentes dele entregam. A diferença não é o modelo. É o substrato em que o modelo escreve.

O desperdício é real, mas a causa foi diagnosticada errado

Os 82% são fáceis de ler como condenação das ferramentas de IA para código. Releia. O dinheiro não evapora no momento da geração. Ele evapora depois, no laço de retrabalho: o agente produz código, um humano revisa, algo está errado, o agente reescreve, o humano revisa de novo. Cada laço queima tokens e queima horas. A geração foi barata. A reconciliação não.

Então a pergunta operativa é o que torna o laço de reconciliação tão caro. Quando um agente escreve em uma base com cinco padrões concorrentes para a mesma operação, três frameworks pela metade da migração, e nenhuma forma canônica de fazer nada, toda geração é um chute. O agente chuta qual padrão o revisor quer. Ele erra uma fração relevante das vezes. O laço de reescrita é o custo desse chute, multiplicado por cada arquivo que o agente toca.

A fragmentação é o imposto. Quanto mais formas de fazer uma coisa, mais vezes o agente faz da forma errada, e mais o rendimento de 18 centavos se corrói. O desperdício não é falha do modelo. É falha do substrato que o modelo herda.

O Spotify é o grupo de controle

O Spotify publicou os próprios números em junho, num artigo de engenharia de Niklas Gustavsson, Arquiteto-Chefe e VP de Engenharia. Trate como dados de primeira mão, auto-reportados, sem auditoria externa. Mesmo com essa ressalva, eles descrevem um universo diferente do dos 18 centavos.

Noventa e nove por cento dos engenheiros do Spotify usam IA toda semana. Noventa e quatro por cento relatam ganho de produtividade. A frequência de pull requests subiu 76 por cento. A base de código de produção cresce sete vezes mais rápido que o quadro de pessoas. Uma migração de versão de Java que historicamente consumiria semanas foi concluída em três dias. E por meio de um sistema chamado Fleetshift, o Spotify fundiu 2,5 milhões de pull requests de manutenção automatizados. (Esse número de 2,5 milhões é do Fleetshift especificamente, não do Honk nem de outra ferramenta interna. Vale manter separado.)

Esses não são os números de uma empresa onde 82 centavos morrem em retrabalho. São os números de uma empresa onde os agentes entregam de primeira com frequência suficiente para que a automação componha em vez de vazar. Mesmo nível de modelo que todo mundo. Rendimento radicalmente diferente.

O que o Spotify construiu e as empresas dos 18 centavos não

A resposta não é um modelo secreto nem um agente proprietário. É uma década de padronização. O Spotify passou anos reduzindo o número de formas aceitáveis de fazer cada coisa. Um sistema de build canônico. Um caminho dourado por linguagem. Um conjunto pequeno e governado de tecnologias em que a organização inteira é fluente.

Gustavsson enuncia o princípio direto: quanto menos tecnologias a empresa lidera no mundo, mais rápido ela vai. A frase soa como restrição, e é uma. Também é a explicação inteira. Um substrato estreito e padronizado é um substrato em que um agente consegue escrever certo na primeira tentativa, porque só há uma resposta certa para chutar.

Essa é a ponte causal que faltava no número dos 82%. Bases padronizadas melhoram de forma mensurável o desempenho dos agentes. Bases fragmentadas o degradam de forma mensurável. O Spotify não comprou agentes melhores. Construiu uma superfície mais limpa para agentes comuns pousarem, e o laço de retrabalho desabou como consequência. A década de padronização não foi feita para a IA. Acabou sendo exatamente a pré-condição de que a IA precisava.

Por que isso inverte a conversa de ROI

A maioria das discussões de custo de IA recorre a um teto de gasto. Se a conta é alta demais e o rendimento baixo demais, estrangule o gasto, racione os assentos, restrinja o acesso. Isso trata o sintoma. O rendimento de 18 centavos não é um problema de gasto. É um problema de substrato fantasiado de gasto.

Limitar o gasto numa base fragmentada baixa o numerador e o denominador juntos. Você gasta menos e entrega menos, e a razão de 18 centavos se mantém. Nada estrutural melhora. O agente continua chutando no caos; você só comprou menos chutes.

A alavanca que de fato move a razão é governança-como-substrato. Padronize os padrões. Elimine os frameworks redundantes. Defina o caminho dourado e imponha ele. Cada forma redundante de fazer uma coisa que você apaga é um chute que o agente não precisa mais dar, e um laço de reescrita que nunca começa. O salto de 76 por cento em PRs e a migração de três dias do Spotify não são o que agentes melhores parecem. São o que um substrato governado faz com os agentes que você já tem.

A leitura estratégica para operadores

Duas empresas, mesmos agentes, mesmo nível de modelo, dois resultados que não compartilham ordem de grandeza. A variável entre elas não é o orçamento de IA. É a década de padronização que está embaixo do orçamento de IA. Uma empresa paga o imposto da fragmentação em parcelas de 82 centavos. A outra quitou esse imposto anos atrás e agora recolhe o dividendo.

Para qualquer operador olhando para um retorno decepcionante de IA, a sequência de diagnóstico está clara. Antes de questionar o modelo, questione o substrato. O desperdício de 82% não está dizendo que os agentes são fracos. Está dizendo que a base é fragmentada demais para qualquer agente escrever nela com limpeza. Conserte o substrato e os mesmos agentes começam a entregar. Não é uma afirmação otimista. É o que o grupo de controle já demonstrou.

Faça isso agora

Rode uma auditoria de substrato antes de rodar uma revisão de gasto. Pegue seus três caminhos de código de maior tráfego e conte o número de formas distintas e aceitas de realizar cada um. Se a resposta for mais que uma, você achou para onde vão seus 82 centavos. O agente está chutando entre seus padrões e perdendo uma fração das vezes, e essa fração é a sua conta de retrabalho. Escolha o padrão canônico, apague as alternativas, e imponha o caminho dourado no CI. Depois remeça sua taxa de merge de primeira passada. A razão que você quer consertar mora no substrato, não no modelo, e o substrato é o único dos dois que você controla.

Fontes

Big Technology, Alex Kantrowitz and Marty Swant. “The Token Reckoning Is Here and It’s Not What You Think.” June 2026.
Spotify Engineering, Niklas Gustavsson. “Coding Is No Longer the Constraint: Teams and Agents at Spotify.” June 2026.

A Victorino ajuda empresas a transformar a base de código em um substrato em que os agentes conseguem entregar, para o gasto com IA virar produto em vez de retrabalho: contato@victorino.com.br | www.victorino.com.br