A Uber Incentivou o Uso Máximo de IA. Quatro Meses Depois, Limitou a Conta.

TV
Thiago Victorino
7 min de leitura
A Uber Incentivou o Uso Máximo de IA. Quatro Meses Depois, Limitou a Conta.

No fim de 2025, a Uber deu uma instrução clara aos seus engenheiros: usem IA o máximo possível. A empresa lançou ferramentas de codificação agêntica, mandou o time mergulhar nelas e classificou o uso de forma competitiva em rankings internos. O consumo era o objetivo, e consumo foi o que ela conseguiu.

Em junho de 2026, a Uber instalou um teto rígido. A Bloomberg noticiou em 2 de junho que a empresa limitou o uso de ferramentas como Claude Code e Cursor em US$ 1.500 por funcionário, por mês, por ferramenta. A razão foi simples. Segundo a reportagem do TechCrunch, a Uber havia queimado todo o orçamento de ferramentas de codificação com IA de 2026 nos primeiros quatro meses do ano, número revelado pelo CTO da Uber em abril.

Esta não é uma história sobre a Uber proibindo IA. O uso continua, e os engenheiros ainda podem ultrapassar o teto com autorização. É uma história sobre como fica a governança de custos quando ela chega depois que o orçamento já foi gasto. A sequência importa mais do que o valor em dólar: incentivar o uso sem limites, ver o orçamento evaporar e então parafusar um teto por cima. O teto é o sintoma. A linha orçamentária ausente é a doença.

A sequência incentivar-depois-limitar

A ordem dos acontecimentos é a história inteira.

A Uber não começou com um envelope orçamentário por assento e um painel acompanhando o consumo contra ele. Começou com um incentivo para consumir. Rankings premiam o topo de uma distribuição, e um ranking de uso de IA premia os engenheiros que mais gastam tokens. É uma decisão de design deliberada, e funcionou exatamente como projetada. A adoção disparou após o lançamento no fim de 2025.

O problema é que ninguém havia precificado o salto. Segundo a The Information, via TechCrunch e Bloomberg, engenheiros individuais geravam contas mensais entre US$ 500 e US$ 2.000 em consumo de tokens assim que as ferramentas chegavam às suas mãos. Multiplique isso pelo tamanho de uma organização de engenharia como a da Uber e o orçamento anual vira um orçamento de quatro meses. A conta sempre ia parar aqui. Só levou até abril para o financeiro enxergar.

Quando o controle finalmente chegou, chegou como um número fixo. Mil e quinhentos dólares, todo engenheiro, toda ferramenta, acompanhado em um painel interno por funcionário, ultrapassável com autorização. É um freio de emergência razoável. Não é governança. Um teto fixo trata o engenheiro que entrega infraestrutura crítica e o engenheiro que experimenta em um branch lateral como classes de risco idênticas. Ele traça a linha em um número redondo porque nenhuma linha melhor estava disponível.

A confissão por baixo do teto

O detalhe mais revelador não é o teto em si. É o motivo pelo qual a Uber não conseguiu desenhar algo mais inteligente do que um número fixo.

Em conversa com a Fortune no fim de maio, o presidente e COO da Uber, Andrew Macdonald, disse a parte que costuma ficar calada. Sobre o vínculo entre gasto com IA e valor entregue: “Esse vínculo ainda não existe.” Sobre as estatísticas internas de uso que a empresa vinha coletando: “é muito difícil traçar uma linha entre uma dessas estatísticas e Ok, agora estamos de fato produzindo tipo 25% mais funcionalidades úteis para o consumidor.” E a consequência, nas palavras dele: “Se você não consegue de fato traçar uma linha direta até [quantas] funcionalidades úteis está entregando aos seus usuários, essa troca fica mais difícil de justificar.”

Leia as três citações juntas e o teto faz sentido. Você não pode escalonar um orçamento por valor se não consegue medir valor. Você não pode dar ao engenheiro de infraestrutura um limite maior que o do experimentador se não tem como provar que o trabalho de infraestrutura entregou mais. Sem uma camada de medição conectando gasto a resultados, o único controle honesto é um controle bruto. O teto fixo é como fica a governança na ausência de um sinal de retorno.

Isso acontece sobre números reais, não hipóteses. O gasto com P&D da Uber no primeiro trimestre de 2026 chegou a US$ 951 milhões, alta de quase 17% ano a ano. O CEO Dara Khosrowshahi afirmou que cerca de 10% do código entregue já é construído por agentes autônomos. O gasto é grande, a produção dos agentes é real, e a empresa ainda não consegue conectar os dois. Esse é o problema de verdade. O teto apenas o torna visível.

O que a Uber prova e os frameworks já previam

Governança de custos para agentes de IA não é uma teoria não resolvida. Os padrões existem. O que faltava era um estudo de caso público e nomeado do modo de falha contra o qual esses padrões alertam. A Uber agora é esse estudo de caso.

O template de governança de crédito que mapeamos antes (quatro modelos de fornecedores para governar o gasto de agentes antes do consumo invisível) descreve exatamente a disciplina que a Uber pulou: uma linha orçamentária explícita, por assento, em painel antes do lançamento, não depois que o orçamento acaba. A Uber inverteu. Construiu o painel depois do consumo de quatro meses, o que torna o painel um instrumento de post-mortem em vez de um controle. Veja Governança de Crédito É o Template para o Gasto com Agentes de IA para a disciplina de linha orçamentária que a Uber instalou na ordem errada.

A camada de medição que falta à Uber também tem nome. Um portão de retorno pré-lançamento amarra gasto a valor entregue antes que o gasto aconteça, de modo que a pergunta “essa troca vale a pena” tenha uma resposta que não seja um chute. O “esse vínculo ainda não existe” de Macdonald é uma descrição precisa de uma empresa operando sem esse portão. Veja o índice de eficiência de inferência como instrumento de governança do CFO para a medição de gasto a valor que o COO da Uber admite não ter.

E a razão de isso ter chegado ao COO e à narrativa de resultados é que o consumo de tokens virou item de conselho, não rodapé de engenharia. Um trimestre de P&D de US$ 951 milhões com um componente de IA não mensurável é, por definição, uma conversa de conselho. Veja a economia de tokens como disciplina de governança do conselho para entender por que isso cai na sala do conselho, e não no backlog do time de plataforma.

Os frameworks eram o alerta. A Uber é o exemplo concreto.

Faça isso agora

Se a sua organização lançou ferramentas de codificação agêntica no último ano e você acompanha adoção, mas não gasto por assento contra um orçamento, você está no início da sequência da Uber, não isento dela. Rode esta verificação antes de fechar o próximo trimestre.

Puxe o gasto mensal de tokens por engenheiro para cada ferramenta agêntica que você implantou. Ordene do maior para o menor. Se o decil de topo gera contas na casa dos US$ 1.000 e você não tem um envelope orçamentário do qual eles estão sacando, o seu orçamento anual é mais curto do que você pensa, e a única pergunta é em que mês ele acaba. Depois faça a pergunta mais difícil: você consegue traçar uma linha de qualquer parte desse gasto até uma funcionalidade entregue que um cliente notou? Se a resposta for a de Macdonald, esse vínculo ainda não existe, então você está comprando consumo na fé, e um teto fixo é o controle ao qual você também vai recorrer.

Instale a linha orçamentária antes do consumo, a camada de medição antes do teto e o escalonamento antes que alguém imponha um número redondo a todos os engenheiros de uma vez. O efeito chicote de incentivar-depois-limitar é evitável. Ele é evitado tratando o gasto de agentes por assento como item orçamentário governado no primeiro dia, não como surpresa em abril.


Fontes

A Victorino ajuda times de finanças e plataforma a instalar orçamentos de agentes por assento e medição de gasto a valor antes que o teto vire a única opção: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa