Microsoft Cancela Claude Code. A Economia de Tokens Atinge a Big Tech.

TV
Thiago Victorino
7 min de leitura
Microsoft Cancela Claude Code. A Economia de Tokens Atinge a Big Tech.

Em 25 de maio de 2026, o TheNextWeb reportou que a divisão Experiences and Devices da Microsoft, responsável por Windows, Microsoft 365, Outlook, Teams e Surface, vai migrar a maior parte dos engenheiros para fora das licenças diretas de Claude Code até 30 de junho. O substituto é o GitHub Copilot CLI, que ainda pode chamar o Claude por baixo, via camada de roteamento gerenciado. Internamente a Microsoft chama isso de “otimização de custo”. A leitura substantiva é outra.

É a primeira admissão pública de uma hyperscaler de que a economia unitária de IA agêntica não fecha aos preços atuais de token.

Pare para considerar quem está tomando a decisão. A Microsoft é a maior investidora individual da OpenAI. A Microsoft é dona do GitHub, o canal pelo qual a maior parte do tooling enterprise de IA para código é vendida. A Microsoft tem o bolso mais fundo de software. Se alguém poderia absorver a conta de token, é a Microsoft. E a divisão que está puxando o plugue não é back office. É a que entrega os produtos que pagam por tudo o mais. Quando a divisão mais bem dotada da empresa mais bem dotada de software do mundo começa a triar licenças de IA por ROI em vez de adoção, a mensagem não é sutil.

A história não é a Microsoft escolhendo Copilot CLI em vez de Claude Code. A história é que a governança de procurement virou a camada estrutural de qualquer estratégia de tooling de IA.

Os Números Que Ninguém Orçou

A reportagem do TheNextWeb trouxe pontos de dado que deveriam recalibrar toda conversa de orçamento de IA em 2026.

Engenheiros da Uber estão gastando entre US$500 e US$2.000 por mês, por pessoa, em tokens de IA para código. Palavras do próprio CTO: “o orçamento que eu achei que precisaria já foi varrido.” A Uber não é uma adotante tímida de IA. A Uber é o estudo de caso que empresas citam quando querem justificar adoção agressiva liderada por engenheiro. Essa mesma empresa está dizendo publicamente que a curva de gasto ultrapassou o modelo de planejamento.

O framework OpenClaw, que orquestra o Claude em loops agênticos estendidos, segundo os relatos consome de US$1.000 a US$5.000 por dia para usuários em planos de assinatura de US$200 por mês. Não é estouro de 10x. É estouro de 150x a 750x, por dia, contra o plano de tabela. Anthropic e outras estão absorvendo a diferença hoje porque a posição estratégica vale mais que a margem unitária. Esse subsídio tem uma data de validade que ninguém publicou.

O número da Gartner é o que deveria fazer todo CFO se endireitar na cadeira. Apenas 28% dos projetos de infraestrutura de IA entregam plenamente o business case. 25% dos orçamentos de IA planejados para 2026 devem escorregar para 2027. O escorregão não é problema de entrega. É problema de dinheiro. A conta chegou antes do valor.

Coloque esses números ao lado da retirada da Microsoft e a foto fica nítida. O fornecedor com o balanço mais forte, a integração mais profunda com o provedor do modelo, e os dados de adoção mais densos dentro dos próprios muros, acabou de decidir que licenciamento direto por seat para o agente de código mais querido da indústria não compensava na margem. Isso é sinal de procurement, não sinal de produto.

O Que a Microsoft de Fato Fez

As manchetes vão dizer que a Microsoft escolheu Copilot CLI em vez de Claude Code. Leia o movimento estruturalmente.

A Microsoft não bloqueou o Claude. O Copilot CLI continua roteando para o Claude quando a camada de roteamento julga que é o melhor modelo para a tarefa. O que a Microsoft removeu foi a licença direta por seat. Engenheiros deixam de ter assinatura ilimitada de Claude Code faturada fora de qualquer envelope de procurement. Passam a acessar o Claude por um cano gerenciado que a Microsoft controla, precifica e instrumenta.

É o padrão de procurement que a TI corporativa aplicou a toda onda anterior de tooling caro. Licenças de banco, plataformas de observabilidade, computação em nuvem. A primeira fase é “engenheiro pode reembolsar”. A segunda é “a conta comeu o orçamento”. A terceira é um gateway gerenciado onde o fornecedor segue sendo consumido, mas o gasto fica delimitado, atribuível e renegociável. A Microsoft acabou de comprimir as três fases em dezoito meses.

A hyperscaler rodando o playbook contra si mesma é a notícia. Todo CTO fora da Microsoft tem agora a mesma pergunta na mesa. Se a divisão de engenharia mais estrategicamente importante da Microsoft não conseguiu absorver seats diretos de Claude Code, quem na sua organização consegue?

A Trajetória Uber

O CTO da Uber não disse “erramos a conta”. Disse que o orçamento que ele achou que precisaria já foi varrido. O verbo é passivo. O custo não excedeu o forecast. O custo demoliu o forecast. É o que acontece quando uma organização compra tooling de IA por reembolso de despesa e descobre depois que o custo unitário é variável, o teto por engenheiro é aberto, e os provedores de modelo têm todo incentivo comercial para deixar o consumo subir até o fim do subsídio.

Toda empresa enterprise que deixa engenheiros reembolsarem ferramentas de IA sem governança de orçamento está na trajetória Uber. Queimar o orçamento do ano em quatro meses. Descobrir em maio que não sobrou envelope para o segundo semestre. Triar no susto. O momento da triagem é o que a Microsoft acabou de fazer em público. A maioria das enterprises vai fazer em privado, em agosto ou setembro, quando o financeiro puxar o livro de gasto de IA e reconciliar contra o plano original.

O padrão que defendemos há meses se aplica diretamente aqui. Quando um benchmark público chegou com teto padrão de US$100 por provedor por mês dentro do protocolo de procurement para agentes, o mercado estava dizendo aos times de plataforma interna como se parecem padrões disciplinados. A retirada da Microsoft é a mesma lição do mercado, recontada do lado da compra. O teto existe porque a curva de gasto, deixada solta, quebra o modelo.

O Que Continua de Pé

Três coisas seguem verdadeiras depois do anúncio da Microsoft, e são a fundação sobre a qual qualquer estratégia de tooling de IA precisa se apoiar agora.

Primeiro, o valor é real onde está governado. Engenheiros usando ferramentas de IA para código dentro de pipeline medido continuam entregando mais rápido que os mesmos engenheiros sem elas. A retirada é sobre seats sem teto, não sobre a capacidade subjacente. A capacidade ganha o próprio lugar quando o gasto tem teto e a saída tem medição.

Segundo, os provedores de modelo vão racionalizar. Anthropic, OpenAI e os demais não conseguem subsidiar estouros de 150x indefinidamente. Preços vão se mover. Rate limits vão apertar. Tiers de assinatura vão se fragmentar. As empresas que montaram fluxos internos de IA em cima dos preços atuais de tabela, sem plano para o dia em que esses preços se moverem, vão reprecificar toda a estratégia de IA no calendário de outra pessoa.

Segundo-e-meio: governança não é freio para adoção, é a condição da adoção sustentada. As organizações que entregam disciplina de procurement e de orçamento primeiro são as que continuam usando as ferramentas quando as outras precisam recuar. Argumentamos o mesmo quando a governança virou feature de produto. O padrão se repete: a disciplina que parecia overhead em 2025 é o kit de sobrevivência em 2026.

Terceiro, a pergunta de workload-harness fit importa mais, não menos. Se você gasta de US$500 a US$2.000 por engenheiro por mês em tokens de IA, a designação de qual carga roda em qual harness deixou de ser decisão de developer experience. Virou decisão de economia unitária. Toda carga que vai pelo harness mais caro quando um mais barato resolveria é linha de custo que o financeiro vai acabar achando.

O Que Fazer Agora

Pare o próximo ciclo de reembolso de ferramentas de IA até que seu CFO consiga responder a uma pergunta. Qual é o teto mensal publicado por engenheiro para ferramentas de IA de código, por ferramenta, por time, neste trimestre? Se a resposta é “não temos”, você está na trajetória Uber. A correção não é reunião. A correção é um teto escrito, uma camada de metering que o aplique, e um gateway gerenciado que roteie engenheiros por ele.

A Microsoft acabou de publicar a lição no maior volume possível. As empresas que ainda estarão rodando seu stack de tooling de IA no Q4 são as que levam essa lição a sério esta semana, não as que esperam o próprio financeiro tocar o alarme em agosto.


Fontes

A Victorino ajuda times enterprise a montar a camada de governança de procurement e orçamento que transforma sprawl de ferramentas de IA em gasto medido e responsável: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa