Os Dois Problemas de Governança no Comércio Agêntico

Já analisamos as guerras de protocolo no comércio agêntico. Três protocolos competindo por $385B em volume de transações. Mas a padronização de protocolos não resolve duas falhas de governança mais profundas.

A primeira: quem governa o que os agentes compram. A segunda: quem governa quanto os agentes custam.

São problemas distintos. Exigem frameworks diferentes, controles diferentes e donos organizacionais diferentes. Tratá-los como um problema só é como empresas perdem o controle de ambos.

Problema um: descoberta sem supervisão

Um fundador apoiado pela Y Combinator descreveu o momento em que sua equipe escolheu um fornecedor de software crítico. Um agente de IA avaliou as opções, selecionou a ferramenta, e a equipe seguiu em frente. Sem RFP. Sem revisão de procurement. Sem matriz de avaliação de fornecedores.

Isso não é uma anedota sobre uma startup cortando caminho. É uma prévia de como compras corporativas vão funcionar quando agentes operarem através de Model Context Protocols, APIs e documentação técnica em vez de interfaces e apresentações comerciais.

Agentes não navegam landing pages. Eles analisam changelogs, leem documentação de API, testam integrações e escolhem o que funciona mais rápido. Matt Williamson chama isso de “crescimento legível por máquina”: o canal de descoberta onde a documentação do seu produto, não seu funil de geração de demanda, determina se um agente o seleciona.

O problema de governança fica óbvio quando você enxerga. Quando humanos selecionam fornecedores, organizações envolvem o processo em controles. Listas de fornecedores aprovados. Limites de orçamento que disparam revisão. Verificações de compliance para tratamento de dados e postura de segurança. Separação entre quem solicita e quem aprova.

Agentes pulam tudo isso. Não por serem maliciosos. Porque esses controles foram desenhados para fluxos humanos nos quais agentes nunca entram.

O risco de concentração se acumula rápido. O framework de Andrew Chen sobre canais de crescimento em mudanças tecnológicas prevê que vencedores iniciais em um novo canal capturam participação desproporcional. Quando agentes priorizam conteúdo técnico (e eles priorizam), os fornecedores com melhor documentação, APIs mais limpas e onboarding mais rápido tornam-se escolhas padrão em milhares de decisões mediadas por agentes. A qualidade da documentação de um fornecedor vira o moat do mercado.

É assim que surge o lock-in invisível. Nenhum contrato o formalizou. Nenhuma equipe de compras o aprovou. Um agente escolheu o caminho de menor fricção, e mil outros agentes fizeram a mesma escolha na mesma semana.

Problema dois: a crise de margem por token

O segundo problema é econômico. Menos visível, porém mais perigoso.

Jamin Ball, da Altimeter Capital, publicou a aritmética que deveria preocupar todo CFO que opera workloads de IA. Uma GPU H100 é alugada por $2 a $4 por hora. Um rack NVIDIA GB300 NVL72 gera aproximadamente um milhão de tokens por segundo, ou quatro bilhões de tokens por hora. Com preços atuais de token, o mesmo hardware produz $600 a $800 por hora em receita.

Releia esses números. A mesma unidade de computação custa dígitos simples para alugar e produz receita de três dígitos em tokens. Margens brutas medianas de SaaS já excedem 80%. Precificação por token empurra as margens ainda mais.

Parece um ganho inesperado. Na verdade, é uma crise de governança.

O alerta de Ball é preciso: “Precifique baixo demais e você estará literalmente pagando clientes para usarem seu produto.” O oposto também vale. Precifique alto demais e você cria uma arbitragem que concorrentes ou equipes de infraestrutura internas dos seus clientes vão explorar. A margem entre esses dois modos de falha é estreita, e se move a cada geração de hardware.

A arquitetura Vera Rubin da NVIDIA, esperada em breve, entrega aproximadamente 5x o throughput com 10x a redução de custo por geração. A cada dezoito meses, o piso cai. Modelos de precificação construídos para uma geração de hardware tornam-se armadilhas de margem na seguinte.

Para empresas que consomem tokens (não que os vendem), a crise é diferente, mas igualmente urgente. Quando uma chamada de agente pode disparar centenas de cobranças downstream de tokens, e quando agentes selecionam ferramentas de forma autônoma que consomem tokens em seu nome, governança de custos se torna uma função que não existia doze meses atrás.

O gasto endereçável total dentro de cada conta é, como Ball coloca, “teoricamente ilimitado”. Um agente que encontra valor em uma ferramenta vai usá-la sem consciência orçamentária. Não vai pausar para verificar se o gasto de tokens deste mês excede a previsão. Não vai comparar o custo por token de um provedor com outro, a menos que alguém tenha construído essa comparação em seu loop de decisão.

A interseção estrutural

Esses dois problemas se cruzam de um modo que torna ambos piores.

Quando agentes escolhem ferramentas autonomamente (problema um), eles geram padrões de consumo de tokens que ninguém previu (problema dois). O agente que selecionou um fornecedor baseado na qualidade da documentação não tem consciência do preço por token da API daquele fornecedor. A equipe de procurement que poderia ter percebido a exposição de custo nunca viu a decisão.

Governança de descoberta sem governança de custo significa que agentes selecionam ferramentas caras livremente. Governança de custo sem governança de descoberta significa que você controla o gasto em ferramentas que não escolheu. Você precisa de ambas, e elas precisam conversar entre si.

Como é essa governança na prática

Para descoberta, os controles são estruturais. Registros de ferramentas aprovadas que agentes devem consultar antes de selecionar novos fornecedores. Trilhas de auditoria para cada decisão de procurement iniciada por agente, mesmo quando (especialmente quando) a decisão parece pequena. Gatilhos de limite que escalam para revisão humana baseados em gasto, acesso a dados ou perfil de risco do fornecedor.

Para custo, os controles são econômicos. Orçamentos de tokens por agente, por workflow, por unidade de negócio. Monitoramento em tempo real de consumo versus previsão. Circuit breakers automatizados quando o gasto excede limites. E, criticamente, governança do modelo de precificação: um processo formal para avaliar se suas premissas de precificação de tokens sobrevivem à próxima geração de hardware.

Nenhum conjunto de controles é exótico. Ambos emprestam de disciplinas que já existem (governança de procurement, gestão de custos de nuvem). A diferença é velocidade. Decisões humanas de procurement acontecem em semanas. Decisões de procurement por agentes acontecem em segundos. Os frameworks de governança precisam operar na velocidade do agente, ou não operam.

A previsão desconfortável

O comércio agêntico não vai esperar a governança alcançar. Agentes já estão selecionando ferramentas, consumindo tokens e tomando decisões de compra em nome de organizações que não têm framework para supervisionar essas decisões.

As organizações que construírem governança de descoberta e de custo agora vão acumular vantagem. Não porque governança é empolgante. Porque gasto de agentes sem governança é a crise orçamentária corporativa que ninguém vê até a revisão trimestral.

Guerras de protocolo vão se resolver sozinhas. Custos de hardware vão continuar caindo. A pergunta que persiste é se sua organização governa o que os agentes compram e quanto custam, ou se você descobre depois do fato.

Fontes

Matt Williamson. “Selling to AI Agents.” Março 2026.
Jamin Ball. “Per Token Pricing Is Coming for Every AI Company.” Março 2026.

Victorino Group ajuda organizações a construir frameworks de governança para procurement e controle de custos de agentes de IA: contato@victorino.com.br | www.victorino.com.br