Seis Mudanças de Preço em 30 Dias. Planos de Assinatura Viraram Artefatos de Governança.

TV
Thiago Victorino
7 min de leitura
Seis Mudanças de Preço em 30 Dias. Planos de Assinatura Viraram Artefatos de Governança.
Ouvir este artigo

Se você assinou um contrato anual de IA antes de 4 de abril, você precificou 2026 errado. Não por um percentual. Por um modelo.

A earnings call da Microsoft sobre a qual escrevi há quatro dias confirmou, no microfone, que licença por assento acabou. O que ela não disse foi por que os laboratórios foram obrigados a puxar o gatilho neste trimestre, em vez do ano que vem, em vez de 2027. Abril é a resposta. Em 30 dias, os três fornecedores que importam para trabalho de IA (Anthropic, OpenAI e GitHub) lançaram seis mudanças estruturais em preços de assinatura. Nenhuma delas foi anúncio de marketing. Todas foram reparos de emergência.

Este é o catálogo. Leia como Parte 2 do post da Microsoft.

A linha do tempo de abril

4 de abril. A Anthropic cortou o OpenClaw e outros harnesses de agentes de terceiros do acesso por assinatura. O plano Max estava sendo usado por ferramentas que envolviam o Claude em agentes autônomos. Um subconjunto desses usuários queimava entre US$ 1.000 e US$ 5.000 por mês em inferência equivalente ao preço de API enquanto pagava US$ 200 pela assinatura. A Anthropic encerrou o acesso, citou os termos de serviço, e pediu para esses usuários migrarem para faturamento por API. Um subsídio de 5x a 25x que o laboratório decidiu não absorver mais.

9 de abril. A OpenAI lançou o Pro 5x a US$ 100/mês para usuários pesados do Codex. O nível existente de US$ 20 cobria o desenvolvedor mediano. O novo nível cobria o desenvolvedor que de fato terminava projetos. Cinco vezes o preço para cinco vezes a alocação. O sinal: o preço mediano vinha sendo errado para o usuário que o produto efetivamente atendia.

13 a 20 de abril. O GitHub congelou novos trials do Copilot Pro, depois pausou todos os signups individuais. Não foi congelamento de funcionalidade. Foi congelamento de crescimento. O produto vendia mais rápido do que a economia unitária aguentava, e o negócio escolheu travar a entrada em vez de continuar diluindo margem. Os custos de inferência subjacentes do Copilot praticamente dobraram ano contra ano contra preços de plano estáticos.

16 de abril. O tokenizador do Opus 4.7 da Anthropic aumentou o uso de tokens em 35% por input. Mesmo prompt, mesmo workload, 35% mais tokens cobrados. Esse não é um aumento de preço que você encontra na página de preços. É uma mudança de unidade enterrada num release de modelo. Quem tinha orçamento modelado em dólares por fluxo viu o custo do fluxo subir 35% enquanto o dashboard mostrava a mesma tarifa por token.

21 de abril. A Anthropic tentou remover o Claude Code do plano Pro, e reverteu depois da reação dos usuários. Sequência reveladora. O laboratório tentou um repackaging unilateral do que uma assinatura Pro incluía, bateu em revolta de usuários, e voltou atrás. A reversão não apaga o sinal. Confirma que os labs estão testando em tempo real o que conseguem retirar dos níveis de assinatura, com os clientes como cobaia.

23 de abril. A OpenAI dobrou o preço da API do GPT-5.5 para US$ 5/US$ 30 por milhão de tokens. O modelo principal, na API onde toda integração enterprise séria é faturada, ficou 2x mais caro de um dia para o outro. Quem tem previsão de custo por token no plano de 2026 já carrega 50% de estouro embutido antes mesmo da adoção crescer.

Seis mudanças. Um mês. Três fornecedores. Cada uma carregando peso num plano corporativo de IA para 2026.

Por que assinatura quebrou como modelo

A curva de tráfego tornou inevitável. O throughput de tokens da API da OpenAI saiu de 6 bilhões por minuto em outubro de 2025 para 15 bilhões em março de 2026. Aumento de 2,5x em cinco meses. Os custos de inferência da Anthropic correram 23% acima das projeções de 2025. A capacidade que os labs alugam dos provedores de nuvem, e as GPUs que compram da NVIDIA, não estão ficando mais baratas nesse ritmo. A demanda está ultrapassando a curva de oferta, e o medidor está na fatura de alguém.

Por dois anos, o medidor ficou no balanço do laboratório. Um plano de assinatura a US$ 20 ou US$ 200 por mês era instrumento de marketing, não instrumento de economia unitária. Dizia ao usuário: “venha construir dentro do nosso editor; vamos absorver o custo enquanto descobrimos monetização.” Todo lab fez a mesma aposta, porque todo lab precisava do ecossistema de desenvolvedores mais do que de margem em 2024.

Essa aposta expirou em abril. Os usuários do OpenClaw foram a gota d’água. Quando 5% dos assinantes consomem 10x a 25x do que pagam, a única forma de manter o preço plano é subsidiar os pesados a partir dos leves. Os leves não se importariam, exceto que os labs também rodavam margem negativa sobre o próprio subsídio. Não há equilíbrio nessa conta. Ou o preço se move, ou o acesso afunila, ou as unidades são redefinidas. Abril entregou as três.

A lição estrutural enterrada no caos

A falha mais profunda não é precificação. É arquitetura.

Preço de assinatura colapsou porque a lógica de negócio estava embutida diretamente no código do produto. “Pro inclui Claude Code” era uma checagem de elegibilidade hard-coded. “Plano Max inclui uso 5x” era uma variável num serviço de billing. Quando o lab quis tirar o Claude Code do Pro, exigiu um deploy. Quando o tokenizador mudou e um token passou a representar 35% mais trabalho, o dashboard de preço por token continuou mostrando o número antigo, porque o dashboard lia a camada errada.

É o que acontece quando monetização não é uma camada separada. Os labs estão agora na posição que toda empresa SaaS eventualmente alcança: a unidade que faturam não é a unidade que o cliente valoriza, a taxa de conversão entre as duas é definida pelo fornecedor, e mudar a taxa exige fazer release de produto. A Salesforce resolveu isso anos atrás separando entitlements de funcionalidades. Os labs estão resolvendo agora, em público, com assinaturas de clientes servindo de ambiente de teste.

A consequência para compras em 2026

Se você negociou um compromisso anual de IA no primeiro trimestre de 2026, seu contrato está precificado errado. Três das seis mudanças acima invalidam premissas que eram padrão um trimestre atrás.

A premissa “o nível Pro cobre seus desenvolvedores” morreu. Usuários pesados agora exigem um nível separado que não existia quando você assinou. Ou você paga 5x pelas pessoas que de fato usam a ferramenta, ou aceita que o nível mais barato vai ser estrangulado debaixo deles.

A premissa “tarifas de API são estáveis” morreu. O GPT-5.5 dobrou. A contagem de tokens no Opus 4.7 subiu 35% por input. Uma previsão de 2026 feita em março já está com orçamento 30% a 50% abaixo do real nas linhas de modelo que importam.

A premissa “assinatura nos dá flexibilidade” morreu. O nível Pro não garante mais acesso ao harness de agentes que sua equipe construiu em volta dele. O lab pode remover o harness, mudar o tokenizador ou cortar integrações de terceiros, e os termos de assinatura permitem. Acesso por assinatura agora é conveniência do fornecedor, não direito do cliente.

O que fazer neste trimestre

Os mesmos três movimentos que defendi no post da Microsoft, com uma adição.

Instrumente a queima no nível do fluxo, não no nível do assento. Uma mudança de tokenizador de 35% deveria ficar visível no seu monitoramento dentro de uma semana após o release, não no fechamento de trimestre quando a fatura chega. Se o seu dashboard de custo de IA lê números do fornecedor em vez de medir os seus próprios, você vai perder toda mudança que mora abaixo da linha de preço por token.

Renegocie todo compromisso anual assinado antes de 4 de abril. Os fornecedores não vão se oferecer para reabrir. Não precisam. Mas todo ciclo de renovação neste ano é agora uma renegociação, e a proposta deve precificar contra a curva que você de fato usa, não contra o nível que o fornecedor está disposto a vender. Sua alavancagem é o dado que você leva para a mesa.

Construa o disjuntor nas ferramentas medidas, nas não medidas, e nas que migraram entre as duas no meio do contrato. Abril acabou de demonstrar que qualquer uma das três categorias pode mudar de uma noite para a outra. O disjuntor não é luxo para times de alto gasto; é a superfície de controle padrão para qualquer ferramenta de IA que toca a sua stack.

E a adição: modele o próximo abril. Os labs estão agora em modo de repricing contínuo. Seis mudanças em 30 dias não é evento isolado. É a nova cadência. Um plano de compras de 2026 que não inclui revisão trimestral de preços vai estar errado pelo segundo trimestre.

O resumo honesto

Preço de assinatura de ferramentas de IA nunca foi preço. Foi subsídio com embalagem de marketing. Abril foi o mês em que a embalagem caiu. Os labs estão agora cobrando próximo do custo, repackaging em tempo real, e tratando níveis de assinatura como artefatos de governança que podem reescrever quando a economia unitária exige.

Times de compras que construíram o plano de 2026 em níveis estáveis de assinatura vão estar errados, no papel, por pelo menos três trimestres. Os times que precificam IA na cadência em que os laboratórios efetivamente operam vão passar o mesmo ano acertando os números.

A earnings call já aconteceu. Abril já aconteceu. A pergunta de maio é se o seu modelo de contrato acompanhou.


Fontes

A Victorino ajuda times de procurement a precificar IA na cadência que os laboratórios efetivamente operam: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa