Token para Resultado Virou a Conta

TV
Thiago Victorino
7 min de leitura
Token para Resultado Virou a Conta

Dois sinais chegaram na mesma semana, de pessoas que não trabalham juntas, e apontaram para a mesma conclusão. Uma investidora de venture argumentou que o elo entre tokens e resultados está virando o lugar onde o poder executivo se concentra. Um CEO de consultoria disse a um jornal que três quartos dos maiores contratos de IA da firma já são faturados em termos variáveis, porque os clientes se recusam a pagar por consumo que não mexe no P&L. Uma estava escrevendo teoria. O outro estava reportando do departamento de faturamento. Os dois concordaram.

Já escrevi sobre custo de token como sinal de conselho e engenharia, sobre a inflexão da força de trabalho quando tokens viram a unidade de trabalho, e sobre o colapso do licenciamento por assento. Aqueles textos argumentaram que tokens são a nova linha de custo. Esse argumento está fechado. Esta semana levou a história adiante. A indústria de serviços começou a se reprecificar em torno de atribuição de resultado, e uma teoria de utilidade marginal do token chegou no mesmo instante para explicar por quê.

O departamento de faturamento fala primeiro

Christoph Schweizer, CEO do Boston Consulting Group, sentou com o The Wall Street Journal em maio de 2026. A BCG cresceu a receita em 7%, para US$ 14,4 bilhões. O número que importa está enterrado na forma como essa receita é estruturada agora. Cerca de três quartos dos maiores contratos de IA da firma já são faturados em termos de taxa variável, em vez de preço fixo de projeto. Acordos puramente baseados em resultado, onde a taxa se liga diretamente a um resultado de negócio medido, ainda são mais raros, “significativamente menos de um terço” de todo o trabalho. Mas a direção é inconfundível.

Schweizer deu a razão em linguagem clara. Os clientes querem trabalho de IA que “não apenas dirija consumo de token, mas de fato veja mudanças no P&L e na forma como as pessoas trabalham.” Leia duas vezes. O CEO de uma das três maiores firmas de consultoria do planeta está dizendo a um jornal que o consumo de token é justamente a coisa pela qual os compradores não querem mais pagar. Eles pagam por um P&L alterado. Pagam por trabalho alterado. O medidor rodando não é resultado. É um insumo que pode ou não produzir um.

Isso é uma admissão estrutural. Quando uma firma que fatura por hora e por entregável começa a atrelar a taxa a um resultado medido, ela está aceitando um risco de atribuição que antes empurrava para o cliente. A BCG está apostando que consegue provar que seu trabalho de IA mexeu um número. Para fazer essa aposta, precisa medir o rastro do gasto até o resultado. A própria conta virou uma reivindicação de atribuição.

A teoria chega na mesma semana

Jaya Gupta, investidora da Foundation Capital, publicou um texto longo em post no X em maio de 2026, intitulado “Token Budget Wars.” O argumento dela corre por baixo da notícia da BCG como uma fundação por baixo de um prédio. A economia da IA agêntica, escreve ela, não é legível por painéis de consumo, e a falha em torná-la legível é onde a próxima camada de controle vai ser construída.

A matemática dela é a parte útil. O mesmo fluxo, com o mesmo input, pode variar de 5 a 10 vezes em custo de token, dependendo de como o agente planeja, repete tentativas e carrega contexto. Uma queda na taxa de conclusão de 90% para 70%, que soa modesta, eleva o custo efetivo por tarefa resolvida em cerca de 28%, porque cada tentativa fracassada ainda queimou tokens antes de fracassar. E o custo de contexto não escala de forma linear. Escala mais ou menos em O(n ao quadrado), porque cada novo token atende a todos os tokens anteriores. Dobre o contexto e você mais ou menos quadruplica o custo de processá-lo.

Empilhe esses três fatos e o painel de consumo passa a enganar de forma ativa. Um time pode cortar a contagem de tokens e ainda assim elevar o custo real por resultado, porque entregou um agente mais barato que falha com mais frequência. Um time pode elevar a contagem de tokens e baixar o custo por resultado, porque comprou a confiabilidade que termina o trabalho na primeira tentativa. Tokens consumidos não dizem nada sobre valor produzido. A frase de Gupta crava o ponto: “O uso de SaaS dizia que o software tinha sido adotado. O uso de IA diz que o medidor está rodando. Não diz se a sua empresa está cozinhando.”

Por que os dois sinais são uma história só

A convergência é a notícia. Gupta descreve, a partir de princípios básicos, por que métricas de consumo falham em capturar valor. A BCG age exatamente sobre essa falha, pela outra ponta, reprecificando sua carteira para que a taxa acompanhe resultados em vez de consumo. Uma é o diagnóstico. A outra é o tratamento, já sendo aplicado aos maiores contratos de IA do mundo da consultoria.

O que conecta os dois é o objeto que nem a métrica de consumo nem o faturamento tradicional capturam: o rastro de decisão. O registro do que o agente foi pedido para fazer, do que tentou, do que repetiu, do que custou, e se o resultado de negócio de fato mexeu. A BCG não consegue faturar por resultado sem esse rastro. Gupta não consegue precificar a utilidade marginal do token sem ele. O artefato durável dessa virada não é o relatório de custo. É o rastro que liga gasto a resultado, tentativa por tentativa.

Painéis de consumo foram construídos para um mundo SaaS onde adoção era o proxy de valor. Você logava, logo recebia valor. A IA agêntica quebra esse proxy. O agente roda tendo sucesso ou não. Ele fatura tendo sucesso ou não. A única forma de saber se você recebeu valor é atribuir o gasto a um resultado, e a única forma de fazer isso é guardar o rastro.

A camada de controle se move

Aqui está a consequência estratégica. Quem é dono da camada de atribuição é dono da conversa sobre se a IA está funcionando. Hoje essa conversa pertence ao fornecedor, porque é ele quem entrega o painel, e o painel reporta consumo. Consumo só sobe. O painel do fornecedor nunca vai te dizer para gastar menos.

Quando a atribuição se move para dentro de casa, a conversa se move junto. O executivo que consegue mostrar que US$ 40.000 de gasto em agente produziram uma mudança medida no P&L tem uma autoridade diferente daquele que só consegue mostrar que o medidor rodou. A BCG está monetizando essa autoridade diretamente ao precificar contra ela. Gupta a nomeia como o ponto onde o poder vai se concentrar. O comprador que a constrói deixa de ser refém do preço da IA.

Faça isso agora

Pare de reportar consumo de token como métrica principal de IA. É um insumo, não um resultado, e abrir com isso treina a organização inteira a otimizar o número errado. Troque por custo por resultado resolvido: gasto total em um fluxo dividido pela contagem de tarefas que ele de fato concluiu a um padrão medido. Essa única razão captura a matemática de taxa de conclusão de Gupta, porque tentativas fracassadas inflam o numerador sem somar ao denominador.

Depois, guarde o rastro. Para cada fluxo de agente que importa, registre o que foi pedido, o que ele tentou, o que custou, e se o resultado de negócio mexeu. Esse rastro é o que permite negociar termos de taxa variável com um fornecedor do mesmo jeito que os clientes da BCG agora negociam com a BCG. É o que permite provar valor ao seu próprio conselho. O relatório de custo te diz que o medidor rodou. O rastro te diz se a sua empresa está cozinhando. Construa o que responde a pergunta que importa.


Fontes

A Victorino ajuda equipes a construir a camada de atribuição que conecta gasto de IA a resultados: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa