Governança de Crédito É o Template para o Gasto de Agentes de IA

TV
Thiago Victorino
9 min de leitura
Governança de Crédito É o Template para o Gasto de Agentes de IA
Ouvir este artigo

Anton Zagrebelny, CTO da Stigg, fez algo raro no mercado de IA: estudou quatro empresas nativas (OpenAI, Cursor, Clay e Vercel) e documentou como cada uma resolve o mesmo problema de forma diferente. O problema é prosaico. Como uma empresa coloca crédito num pote comum, distribui entre times e impede que alguém torre o orçamento do trimestre numa tarde?

A resposta depende de qual fornecedor você contrata. E se contratar três deles, vai herdar três respostas incompatíveis.

O texto Four Models for Credit Governance, publicado em 16 de abril de 2026, é a leitura mais honesta disponível sobre governança de gasto de IA hoje. Zagrebelny recusa o tom heroico, nomeia arquiteturas com especificidade de engenheiro, descreve decisões de ledger que parecem técnicas mas são políticas disfarçadas. A contribuição dele é a taxonomia. A nossa é o que a taxonomia ainda não alcança.

Os quatro modelos, em uma respirada

OpenAI, Decision Waterfall. Um único caminho síncrono resolve tudo: limites de taxa, créditos gratuitos, contratos corporativos, RBAC. Hierarquia de três níveis: Organização, Projetos, Chaves de API. O time da OpenAI rejeitou plataformas terceirizadas de billing por não entregarem “consciência imediata de limite”. É a mesma restrição que redes de cartão resolveram com autorização stand-in em menos de 100ms.

Cursor, Dollar-Denominated Pools. O pool de crédito é o preço do plano em dólares. Pro custa vinte dólares por mês, Teams quarenta. Um crédito vale um centavo de custo de API. A decisão é de legibilidade: o cliente enxerga quanto gastou, não quantas “fast requests” evaporaram numa abstração proprietária.

Clay, Dual-Currency Separation. Duas moedas, uma plataforma. Actions (orquestração, custo fixo de 1 por tarefa) separadas de Data Credits (dados de terceiros, custo variável de 0,5 a 10+ por consulta). Categorias com comportamentos diferentes precisam de orçamentos diferentes, análogo a linhas de crédito de capital de giro separadas de facilidades de trade finance.

Vercel, Observability-First. Nenhuma hierarquia prescrita. Cada requisição carrega tags em tempo de execução (usuário, cliente, plano, feature). A API de relatórios expõe seis dimensões. Enforcement acontece por webhook quando o threshold é ultrapassado. Governança por observação: você não barra antes, você vê primeiro.

Zagrebelny descreve cada modelo com respeito. E deveria. Todos funcionam para o caso que foram desenhados. O problema é o caso que nenhum foi desenhado para atender.

O que a analogia bancária entrega, e o que ela esconde

Há uma leitura tentadora. Os fornecedores de IA estão reinventando primitivas bancárias dos anos 1980 com nomes novos. Decision waterfall é a cascata de autorização. Hold-and-settle é pré-autorização e captura. Pools denominados em dólar são contas de depósito à vista. Entitlements hierárquicos são programas de cartão corporativo.

Parte da analogia transfere limpo. Hierarquia de entitlements, atribuição de seis dimensões, autorização síncrona em menos de 10ms: tudo isso foi resolvido décadas atrás por redes de pagamento e sistemas de stored-value. Engenheiros de IA não precisam reinventar a roda.

A analogia tem limite. Zagrebelny raciocina de dentro da engenharia de billing SaaS para dentro da IA, não de dentro de risco de crédito de consumo. Isso importa. O que os fornecedores de IA estão construindo não é uma rede Visa com subscrição, reservas e perda esperada modelada. É um livro-razão pré-pago com direitos de uso. Mais próximo de vale-presente corporativo do que de crédito rotativo.

Isso não diminui o trabalho. Torna o diagnóstico mais preciso.

A lacuna de velocidade

Eis o problema que nenhum dos quatro modelos resolve, e que a analogia bancária não nos ajuda a enxergar.

Numa rede de cartão, a perna de autorização roda mais rápido do que a transação pode ser consumada. O posto não libera combustível até o auth voltar aprovado. A janela de enforcement corre na frente do custo.

Com agentes de IA, a ordem se inverte. Um agente bem escrito encadeia chamadas de ferramenta, cria subagentes, dispara requisições paralelas mais rápido do que qualquer camada central consegue reagir. Um agente descontrolado queima dez mil dólares em noventa segundos. O livro-razão central enxerga o estrago depois que ele aconteceu.

A consequência é estrutural. Governança de gasto de IA precisa empurrar enforcement para dentro do runtime do agente: envelopes de orçamento locais, kill-switches por invocação, tetos duros por execução. Confiar que o estado central vai segurar o baque é garantia de prejuízo. Isso é mais próximo de billing em tempo real de telecom do que de autorização de cartão. E telecom nunca teve que lidar com a topologia de agentes que geram subagentes.

Aqui está o ponto central. Os quatro modelos que Zagrebelny documenta tratam a chave de API como fronteira de enforcement. Quando um agente dentro daquela chave dispara mil sub-requisições, o ledger vê mil requisições autorizadas, cada uma dentro do limite. O custo emergente é inválido pela política e válido pelo ledger ao mesmo tempo. A governança falha não porque o limite está errado, mas porque está no lugar errado.

Como exploramos em A Lacuna de Ferramentas de Governança entre Domínios, engenharia já tem Cloudflare. Outras funções ainda montam governança com peças soltas. Finanças entra agora nesse mapa, e entra por uma porta que nenhum dos quatro fornecedores trancou direito.

O que o comprador precisa exigir

Se você é CFO ou CIO contratando três fornecedores de IA neste trimestre, o diagnóstico é curto.

Escolha a hierarquia antes do fornecedor. Empresa centralizada, o modelo OpenAI cabe. Empresa matricial com engenheiros servindo a dois projetos, Cursor e seus pools por usuário. Separação por categoria de custo (greenfield e refactoring, por exemplo), Clay ou algo que o imite. IA voltada ao cliente com custo por conta, Vercel é o ponto de partida.

Exija enforcement no runtime do agente. Pergunte ao fornecedor: se um agente dentro de uma chave válida dispara cem chamadas paralelas que emergem num custo acima do orçamento, onde o corte acontece? Se a resposta for “no próximo ciclo de reconciliação” ou “quando o webhook dispara”, você não tem enforcement. Tem observação com atraso.

Não confunda legibilidade com previsibilidade. Crédito denominado em dólar responde uma pergunta (quanto eu gastei) e não responde outra: quanto eu vou gastar. Como discutimos em Tokenmaxxing: a Inflexão da Força de Trabalho de IA, consumo de tokens virou eixo de performance. O orçamento precisa seguir esse eixo, não o contábil antigo.

Planeje sua própria cobertura de risco. No crédito tradicional, o emissor carrega o risco do tomador. Na IA, o comprador carrega o risco dos próprios agentes. Não existe segurador cobrindo agente descontrolado. Cada empresa se autoassegura: reservas orçamentárias, kill-switches, protocolos de escalação. Dinheiro parado que antes não precisava estar parado.

Onde isso leva

A observação mais interessante no texto de Zagrebelny talvez seja a que ele não faz. Os quatro modelos cobrem governança do lado do fornecedor. Nenhum resolve governança do lado do comprador, ou seja, o que acontece quando a empresa tem três fornecedores, três hierarquias, três esquemas de atribuição, e precisa consolidar “gasto de IA deste mês” numa única linha de relatório.

Essa camada ainda não existe. Vai existir. O espaço é o que a Cloudflare ocupou para identidade e segurança: governança transversal que não concorre com os fornecedores, consolida seus sinais. Como argumentamos em A Separação da Governança do Comércio Agêntico, há dois problemas em jogo, o lado do agente e o lado do merchant. Crédito de IA é o mesmo padrão aplicado a custo.

Enquanto a camada não vem, o trabalho do CFO é escolher modelos deliberadamente em vez de herdar, por inércia, o que os três fornecedores mais ruidosos do trimestre entregam. A decisão é de política, não de procurement. E políticas, a história do crédito ensina, compõem. Você não escapa das consequências de hoje resolvendo o problema de ontem.


Fontes

  • Zagrebelny, Anton. “Four Models for Credit Governance: What OpenAI, Cursor, Clay, and Vercel Can Teach You About Hierarchical Spend Control.” The Financial Engineer. Abril 2026.
  • Ramp. “AI Index, April 2026.” Abril 2026.
  • Amazon Web Services. “Build a proactive AI cost management system for Amazon Bedrock (Parts 1 & 2).” AWS ML Blog. 2026.
  • Mastercard. “Mastercard Agent Pay: Agentic tokens & governance framework.” 2026.
  • Zagrebelny, Anton. “Trade-Off Engineering of Credit Systems: Ledgers, Wallets, Rollover, and Decisions That Compound.” The Financial Engineer. 2026.

Ajudamos equipes de finanças e plataforma a desenhar governança de gasto de IA que aplica limites em velocidade de agente: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa