Cinco Fornecedores, Uma Arquitetura: A Camada de Controle de Agentes Virou Categoria de Produto

TV
Thiago Victorino
9 min de leitura
Cinco Fornecedores, Uma Arquitetura: A Camada de Controle de Agentes Virou Categoria de Produto
Ouvir este artigo

Entre 13 e 17 de maio de 2026, cinco fornecedores sem qualquer roadmap compartilhado publicaram a mesma tese arquitetural. O time de engenharia do Claude Code, da Anthropic, escreveu que “o harness importa tanto quanto o modelo”. A Intercom (agora rebatizada Fin) lançou o Fin Operator, uma IA cujo único trabalho é supervisionar outra IA, com um portão duro de aprovação antes de qualquer alteração tocar produção. A Docker liberou Custom MCP Catalogs e Profiles, distribuindo pacotes curados de ferramentas via artefatos OCI. Nader Dabit publicou uma especificação de seis hooks de ciclo de vida para controle determinístico de agentes. Jamin Ball, da Altimeter, colocou na planilha: “Se seu produto não pode ser invocado como skill dentro daquela superfície de agente, você está funcionalmente invisível.”

Cinco categorias distintas. Uma tese arquitetural única. A camada fora do modelo, hooks, skills, catálogos, portões de proposta, governança de marketplace, é onde a governança de agentes de fato acontece. Defendemos isso por meses. Esta semana deixou de ser nossa tese e virou categoria de produto sendo entregue.

A planilha de compras ganhou uma linha chamada “camada de controle”. Os fornecedores estão competindo para dominá-la.

Cinco Fornecedores, Cinco Camadas, Um Edifício

O padrão só fica nítido quando você empilha os movimentos lado a lado. Cada fornecedor está reivindicando um andar diferente do mesmo edifício.

A Anthropic domina a camada do harness. O post do time de engenharia do Claude Code sobre grandes codebases descreve a arquitetura sob o modelo: hooks de pré-ferramenta, hooks de pós-ferramenta, sistema de arquivos como memória, despacho de sub-agentes, descoberta de skills. A frase deles, o harness importa tanto quanto o modelo, é uma admissão de que a performance vem do andaime, não dos pesos. O modelo vira commodity quando o harness está certo.

A Fin domina a camada de supervisor. Brian Donohue, VP de Produto da Fin, é direto: “Nesse momento, estamos correndo zero risco. A Fin não pode fazer qualquer alteração no sistema sem aprovação humana. Nada entra em produção até que uma pessoa clique em aplicar.” O Fin Operator roda o Claude, da Anthropic, em vez dos modelos Apex da própria Fin, porque o trabalho dele, supervisionar outro agente, se parece mais com engenharia de software do que com atendimento. A Fin já resolve mais de 2 milhões de tickets por semana em 8.000 clientes. O beta do Operator começou com cerca de 200 deles. O portão de proposta é o produto.

A Docker domina a camada de distribuição. O post de Bobby House é o mais discretamente importante da semana: “Conforme o MCP cresce, o desafio não é acesso a ferramentas, é coordenação. Times precisam padronizar o que é confiável e suportado sem restringir como cada um trabalha.” Custom MCP Catalogs viajam por artefatos OCI, a mesma cadeia que já move imagens de contêiner. Profiles suportam agrupamentos nomeados ilimitados, filtragem de ferramentas e compartilhamento entre times. A Docker está colocando servidores MCP nos mesmos trilhos de confiança que as empresas já auditam.

Nader Dabit domina a camada de determinismo. O post Agent Hooks é a declaração de engenharia mais limpa da semana: “Use prompts para orientação. Use hooks para comportamento que deve rodar toda vez.” Ele nomeia seis eventos de ciclo de vida, SessionStart, UserPromptSubmit, PreToolUse, PostToolUse, Stop, SessionEnd, e mostra por que cada um é onde a política determinística mora. Prompts são best-effort. Hooks são garantidos. A camada de hook é onde compliance vira código.

A Altimeter domina a camada de marketplace. A leitura de Jamin Ball tem clareza de investidor. A “superfície do agente” está virando a nova app store, e skills são os novos apps. Se um produto SaaS não puder ser invocado como skill dentro daquela superfície, ele perde lugar. A camada de controle não é só primitiva de engenharia. É canal de distribuição com dinâmica de categoria, efeito de rede e sinais de confiança vinculados.

Cinco andares. Um edifício. Cada fornecedor competindo para ser o dono de um andar enquanto todos concordam que o edifício existe.

A Cara do Edifício Quando Você Recua

Empilhe as camadas e a arquitetura fica legível:

  1. Distribuição. Como pacotes confiáveis de ferramenta chegam ao workspace. A Docker está na frente; OCI é o trilho que já existe.
  2. Marketplace. Como descoberta, ranqueamento e invocação acontecem dentro da superfície do agente. A Altimeter enxerga a categoria se formando; os fornecedores ainda não estão lá.
  3. Harness. Como o modelo é embrulhado, o que ele enxerga, qual contexto carrega, quais sub-agentes pode acionar. A Anthropic lidera.
  4. Determinismo. Como política inegociável é aplicada apesar da deriva de prompt. Nader Dabit articulou a especificação; todo mundo implementa variantes.
  5. Supervisor. Como agentes autônomos são revisados por outro agente antes da ação cair no sistema real. A Fin é a primeira prova em produção e em escala.

Esses não são cinco produtos. São cinco superfícies de um único runtime, e precisam se interoperar. Uma skill distribuída pela Docker, invocada de um marketplace, executada dentro do harness da Anthropic, controlada por um hook de determinismo e aprovada por um supervisor estilo Fin é um único workflow. Hoje, são cinco fornecedores e zero padrões.

Essa é a parte que ninguém entregou esta semana.

O Que Ainda Falta

A camada de controle é real. A história de integração não é. Três deficits se destacam, e é aí que mora o próximo ano de trabalho.

Interoperabilidade de política entre fornecedores. Uma especificação de hook do Nader Dabit não é um artefato portável. Um Docker Profile não é lido pelo loader de skills da Anthropic sem tradução. Um portão de proposta da Fin não fala o mesmo formato de auditoria que uma reprodução em sandbox da Vercel. Cada fornecedor está erguendo um andar crível. Nenhum publica como o andar dele conversa com o de cima. Empresas acabam refazendo a cola, de novo, para cada nova ferramenta.

Padrão de log de auditoria. Cada camada emite a evidência dela. Hooks disparam e logam em algum lugar. Skills executam e logam em outro. Aprovações de supervisor caem num terceiro. Invocações de marketplace somem na analytics do fornecedor. Um regulador perguntando “me mostre todas as ações que essa frota de agentes tomou no último trimestre, quem aprovou, e qual política pegou o quê” não obtém resposta coerente hoje. A camada de controle precisa de uma especificação no formato OpenTelemetry para governança de agentes. Ninguém tomou esse pedaço ainda.

Sinal de confiança no marketplace. Ball está certo de que skills são os novos apps. App stores amadureceram exatamente porque têm sinais de confiança: binários assinados, filas de revisão, processos de remoção, manifestos de versão. O marketplace de skills ainda não tem nada disso. Docker Catalogs estão mais perto do que qualquer um porque artefatos OCI já carregam assinatura. Mas um administrador de workspace ainda não consegue perguntar “essa skill veio de um fornecedor com quem tenho contrato, e qual o status de revisão dela?” e receber resposta estruturada.

Cobrimos o primeiro sinal dessa categoria em governança como produto, três fornecedores, maio de 2026 e mapeamos as raízes arquiteturais em Symphony, a especificação da camada de controle e hooks de agente como superfície de persistência. O formato era visível. Esta semana nomeou.

Por Que Compras Deveria Se Importar Neste Trimestre

Quando uma categoria sai de emergente para legível em uma semana, o cronograma de compras se move. O comprador que ia escrever um RFP no ano que vem agora tem itens comparáveis hoje. Um administrador de workspace pode perguntar a cada finalista cinco questões concretas:

  • Quais hooks de ciclo de vida vocês expõem, e quais são obrigatórios versus opcionais?
  • Como skills são distribuídas para nosso workspace, e qual a cadeia de custódia?
  • Qual é o mecanismo de supervisor para mudanças autônomas, e em que formato fica a auditoria de aprovação?
  • Como os eventos da camada de controle de vocês aparecem no nosso SIEM e na camada de identidade que já temos?
  • Qual é a história de interop quando misturamos vocês com os outros quatro andares?

Essas perguntas não são mais teóricas. Cada fornecedor no campo acima respondeu pelo menos uma delas publicamente nesta semana. O comprador que deixar esse conhecimento passar está comprando modelo e levando um runtime que não especificou.

Já argumentamos que o padrão da gaiola para governança de frotas de agentes descreve como times em produção já vivem dentro dessa arquitetura. Os movimentos desta semana confirmam. A gaiola deixou de ser metáfora. É uma pilha de camadas nomeadas, sendo entregue sob marcas nomeadas.

Faça Isso Agora

Escolha um workflow de agente que a sua organização roda em produção. Trace pelas cinco camadas. De onde vem o pacote confiável de ferramenta? Como o modelo é embrulhado? Quais hooks aplicam política? Quem ou o que supervisiona a ação autônoma antes dela cair? Onde vive a evidência de invocação para auditoria?

Anote a resposta. Se três ou mais camadas resolverem em “o prompt cuida” ou “o desenvolvedor sabe”, você está rodando em best-effort, não em camada de controle. Os fornecedores que entregaram nesta semana estão apostando que best-effort é exatamente a parte que a categoria está substituindo. Quanto mais rápido você mapear sua pilha, mais rápido pode escolher qual fornecedor ocupa qual andar, e onde vale a pena construir a cola por dentro.

A camada de controle não é mais tese. É linha de item. Compras percebeu.


Fontes

A Victorino ajuda empresas a desenhar e operar a camada de controle de agentes que os SDKs dos fornecedores assumem que você já tem: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa