A economia da IA fraturou em três eixos na mesma semana

Por dois anos, o consenso de mercado foi simples: modelos ficam melhores, mais baratos e mais rápidos, e a curva dura para sempre. Compradores construíram orçamentos com base nessa curva. Investidores construíram múltiplos. Fornecedores construíram roadmaps. E executivos de tecnologia construíram promessas para o conselho.

Em uma única semana de abril de 2026, três sinais independentes abriram três rachaduras na mesma curva.

Toby Ord publicou uma análise mostrando que o custo por tarefa dos agentes de fronteira está subindo de forma exponencial, não caindo. A Cursor publicou dados de 500 empresas mostrando que modelos melhores não reduzem consumo. Aumentam. E Jason Lemkin, na SaaStr, acusou publicamente o setor de inflar “Contracted ARR” em 2 a 3 vezes.

Três pesquisadores, três ângulos, três conjuntos de dados. Nenhum deles combinou com o outro. Todos chegaram à mesma conclusão em dias: os números de manchete da economia de IA não estão contando a história real.

Isso não é uma tese. É um momento. E ele redesenha o que significa ter vantagem competitiva quando a capacidade vira commodity, o custo volta a subir e a receita é contestada.

Ato 1 — Ord: o custo por tarefa subiu, não caiu

O primeiro eixo é o mais contraintuitivo. Quase toda conversa executiva sobre IA em 2026 começa com a premissa de que o custo por token está em queda livre. E está, para o mesmo modelo, no mesmo nível de raciocínio.

O problema é que ninguém quer o mesmo modelo. Todo mundo quer o modelo de fronteira. E o modelo de fronteira faz mais trabalho, gasta mais tokens por tarefa e custa mais por hora de trabalho executado.

Ord mostra que, em sete anos, os parâmetros de modelo cresceram cerca de 4.000 vezes e os tokens gerados por tarefa cresceram cerca de 100.000 vezes. O custo por token caiu, sim. Mas o custo por tarefa, que é o que importa para quem contrata um agente, subiu.

No ponto doce, um agente roda a cerca de 0,40 a 40 dólares por hora de trabalho, dependendo do modelo. Na saturação, quando você deixa o orçamento de raciocínio solto, a faixa vai de 13 a 350 dólares por hora. O baseline humano de um desenvolvedor de software nos Estados Unidos é algo em torno de 120 dólares por hora.

Na média, ainda vale a pena. Na fronteira de alta capacidade, já não vale. E a direção da curva é para cima.

Ord escreve: “esses sistemas de IA de ponta estariam ficando menos competitivos em custo com humanos ao longo do tempo”. Não é uma previsão. É o que os dados dele dizem.

Uma ressalva honesta: o modelo de equivalência de tokens por hora de Ord parte de uma suposição forte sobre produtividade humana, e o valor de 350 dólares por hora é o caso de saturação, não o típico. Mas a direção não muda com o ajuste. O custo por tarefa está subindo no topo da curva.

Ato 2 — Cursor: a eficiência não corta a conta, ela aumenta o uso

O segundo eixo vem do terreno onde ninguém esperava. A Cursor analisou 500 empresas entre julho de 2025 e março de 2026. A tese popular era: modelos ficam melhores, logo você precisa de menos mensagens para fazer a mesma coisa, logo a conta cai.

Os dados mostraram o contrário. As mensagens semanais cresceram 44% no período. Não caíram.

Detalhando por tipo de trabalho: tarefas de alta complexidade cresceram 68%. Documentação, 62%. Arquitetura, 52%. Revisão de código, 51%. UI e estilização, 15%.

A Cursor descreve isso como um efeito Jevons: ganhos em eficiência aumentam o consumo total em vez de reduzi-lo. É o mesmo padrão que William Stanley Jevons observou em 1865, quando máquinas a vapor mais eficientes levaram ao uso de mais carvão, não menos.

Traduzindo para a linguagem de CFO: sua conta de IA não caiu. Seu uso de IA subiu 44% porque o modelo ficou bom o suficiente para você tentar coisas mais ambiciosas.

Duas ressalvas. A amostra é de usuários Cursor, inerentemente entusiastas de IA, portanto não lê como mercado geral. E Jevons, historicamente, não é vilão: mais trabalho valioso sendo feito é, em muitos casos, uma coisa boa. A preocupação não é Jevons em si. É Jevons sem medição.

Sem medição, você não sabe se o aumento de 44% em mensagens virou 44% de valor entregue, ou se virou 44% de loops de retrabalho com um modelo ansioso. O dado agregado não distingue. E ninguém está auditando a distinção.

Ato 3 — Lemkin: o ARR que você está precificando pode não ser real

O terceiro eixo é o mais desconfortável. Jason Lemkin, fundador da SaaStr e investidor há décadas em SaaS, publicou um texto chamando o setor de IA para uma conversa que ninguém queria ter: “está na hora de expor o Contracted ARR”.

A mecânica é a seguinte. Uma startup de IA fecha um contrato de 3 anos por 15 milhões de dólares. Receita real do ano corrente: 5 milhões. ARR reportada em pitch deck: 15 milhões, porque “é tudo contratado”. O múltiplo aplicado em cima dessa ARR inflada vira preço de rodada.

Lemkin estima que, no setor de IA, o Contracted ARR pode estar inflando a ARR real em 2 a 3 vezes. Uma empresa que diz estar a 6 milhões de dólares em ARR crescendo 180% pode, descontada a ginástica contábil, estar a 2 milhões crescendo bem menos.

A frase dele é direta: “todo VC tem uma fraude no portfólio”. É linguagem de prática, não de auditoria. Mas é uma voz credível em um debate vivo. O debate existe porque os números de manchete param de bater com unit economics quando você olha duas camadas abaixo.

Essa é a terceira rachadura. Os dois primeiros sinais atacam o lado do custo. Este ataca o lado da receita. Juntos, eles dizem que o numerador e o denominador da curva “IA fica cada vez melhor em dólares” estão ambos contaminados.

O que os três têm em comum

Cada um desses três sinais, isolado, é fácil de descartar. Ord é acadêmico. Cursor tem conflito de interesse. Lemkin é opinativo.

O que torna a semana relevante é que os três atacaram a mesma premissa por ângulos completamente diferentes e chegaram à mesma posição: os números que a indústria publica para descrever a economia da IA não estão sendo medidos de forma que suporte a decisão que executivos precisam tomar.

Custo por tarefa não é custo por token. Uso não é valor entregue. ARR contratada não é ARR realizada.

Como exploramos em A Pergunta de US$ 500 Bilhões: Por Que Governança É o Único Fosso de IA que Sobrevive e em NVIDIA Captura 79% do Lucro de IA. Aplicações, 7%. A Cadeia Não Vai Se Corrigir., a tese de fosso em IA depende de onde você mede, não do quanto você gasta. Está semana endossa a tese pelo caminho contrário: quando a medição falha em três eixos ao mesmo tempo, qualquer narrativa de vantagem construída sobre esses números vira especulação.

A pergunta que fica: qual é o fosso quando tudo que se mede é contestado?

Quando capacidade vira commodity, custo sobe em vez de cair e receita é contestada, a vantagem competitiva migra para quem consegue medir o que os outros não medem.

Isso não é uma resposta genérica sobre “ser data-driven”. É algo mais específico. Três perguntas que, em abril de 2026, passam a separar operação madura de IA de operação narrativa:

Primeira: qual é o seu custo por tarefa, não por token, não por chamada, mas por tarefa fechada com qualidade aceita? Se você não sabe, você não sabe se seu agente substitui ou amplifica uma hora de trabalho humano.

Segunda: o seu aumento de uso de IA corresponde a um aumento equivalente de valor entregue? Se a conta subiu 44% e a entrega subiu 10%, você está pagando pelo efeito Jevons sem colher o efeito Jevons.

Terceira: a receita que você reporta ao conselho, ao investidor e ao mercado é a receita que você reconheceu no trimestre, ou é a receita que você contratou para os próximos anos? Se os dois números divergem por um fator de 2 ou 3, a transparência dessa divergência é parte do seu balanço de riscos.

Nenhuma dessas três perguntas é respondida pelo fornecedor do modelo. Nenhuma é respondida pelo dashboard padrão de uma plataforma de agentes. E nenhuma é respondida por uma planilha de controle financeiro montada antes de 2025.

Essa é a rachadura estrutural que está semana expôs. Os três sinais não vão se reconciliar sozinhos. O consenso “mais barato e melhor para sempre” já não é uma descrição do presente. É uma frase de marketing. O próximo ciclo de decisão de capital em IA vai premiar quem mede, e penalizar quem herdou premissas de 2024.

Integridade de medição não é compliance. É o fosso.

Fontes

Ord, Toby. “Are the Costs of AI Agents Also Rising Exponentially?” Abril 2026.
Cursor. “Better AI Models Enable More Ambitious Work.” Abril 2026.
Lemkin, Jason. “It’s Time to Expose Contracted ARR.” SaaStr, Abril 2026.

Ajudamos equipes a medir o que a IA realmente entrega quando os números de manchete não são confiáveis: contato@victorino.com.br | www.victorino.com.br