O núcleo de um agente de ponta é um while

Um preprint publicado no arXiv em 14 de abril analisou o código-fonte TypeScript do Claude Code e chegou a uma conclusão que parece decepcionante no primeiro parágrafo e libertadora no segundo. O núcleo do agente é um while. Chama o modelo, executa a ferramenta que o modelo pediu, volta ao início. Não há segredo arquitetural. Não há motor proprietário. Não há otimização matemática escondida no centro.

O que existe está ao redor desse laço. É ali que mora o trabalho sério.

Os autores descrevem a estrutura: um sistema de permissões com sete modos e um classificador baseado em machine learning, um pipeline de compactação de contexto em cinco camadas, quatro mecanismos de extensão (MCP, plugins, skills e hooks), delegação a subagentes com isolamento por worktree, e armazenamento de sessão append-only. Cada uma dessas peças é significativamente mais complexa do que o while central. E é essa assimetria que importa.

Simples no motor, denso no perímetro

A narrativa dominante sobre agentes sugere o oposto. Startups anunciam “arquiteturas cognitivas” proprietárias, grafos de raciocínio, camadas de meta-planejamento. O preprint mostra que, no agente mais usado do mercado, nada disso define o comportamento. O que define é o que cerca o laço.

Isso não é uma crítica. É uma leitura arquitetural honesta. Colocar a sofisticação no perímetro é uma decisão de engenharia com consequências concretas: cada ponto de complexidade se torna auditável em isolamento. O sistema de permissões pode ser revisado sem tocar no laço. O pipeline de compactação pode ser reescrito sem quebrar ferramentas. Os hooks podem ser trocados sem que o modelo mude de comportamento. A governança, na prática, acontece nessas superfícies, não dentro da inferência.

É o mesmo padrão que aparece em bancos de dados maduros, em kernels Unix, em compiladores antigos. O núcleo é pequeno e resiste à mudança. A complexidade acumula nas bordas, onde pode ser manipulada sem risco sistêmico.

O que isso significa para quem opera agentes

Se você está tentando governar um agente em produção, a leitura dos autores é útil porque reordena a pergunta. Não adianta interrogar o modelo. Não adianta exigir “explicabilidade” do while. O ponto de alavancagem é o perímetro.

Três superfícies concretas:

Ferramentas. Cada ferramenta que o agente pode invocar é um contrato. Ela define o que ele pode tocar, que argumentos aceita, que retorno produz. Como mostramos na análise do vazamento do código-fonte, o catálogo de ferramentas é o mapa do que o agente faz de fato. Muito mais do que qualquer prompt de sistema. Se a ferramenta não existe, a capacidade não existe. Se a ferramenta é ampla, a capacidade é ampla.

Prompts. O prompt não é “mágica”. É a camada de contexto que estabelece o que o laço sabe sobre o mundo antes de agir. Em sistemas reais, prompts viram artefatos versionados, revisados como código, com testes de regressão. Quando equipes tratam prompt como string solta no repositório, estão abrindo mão da governança sem perceber.

Checkpoints. Permissões, classificador de dois estágios, worktrees isolados, armazenamento append-only. Esses são os pontos onde o sistema pode parar, pedir autorização, ou registrar o que aconteceu. Como discutimos no modo auto, a decisão de quando parar e quando seguir em frente é, no limite, uma decisão política. O código só executa.

Quem opera um agente sem mapear essas três superfícies está operando no escuro.

A simplicidade do núcleo é um sinal

Há algo mais a notar. Quando os autores mostram que o núcleo é um while, estão dando ao leitor um presente de transparência arquitetural. Quer dizer: o comportamento do agente pode ser raciocinado. Não há caixa preta no meio. A caixa preta é o modelo que o while chama, e essa é uma caixa preta conhecida, com sua própria disciplina de avaliação.

Isso contrasta com agentes que escondem complexidade no próprio motor. Quando a orquestração interna é opaca, auditar o sistema vira impossível. Não dá para saber se um comportamento indesejado veio de uma decisão do modelo, de uma regra do orquestrador, ou de uma interação entre os dois. Colocar o orquestrador como laço simples elimina essa ambiguidade.

Para quem está construindo agentes internos, a lição é prática: resista à tentação de sofisticar o núcleo. Se a sua arquitetura exige um motor proprietário com lógica própria, pergunte se essa lógica não deveria estar no perímetro. Em uma ferramenta, em um prompt, em um checkpoint. Quase sempre deveria.

O que isso não resolve

Seria desonesto terminar o texto sem um contrapeso. O while simples resolve o problema de orquestração. Não resolve o problema de correção. Um agente com núcleo simples ainda pode chamar a ferramenta errada, encadear decisões ruins, ou ser manipulado por input adversarial. A simplicidade arquitetural é condição necessária para governança, não suficiente.

Também vale lembrar que o preprint é uma análise de fonte observável, não um documento oficial da Anthropic. Os autores interpretam o código; a Anthropic pode ter intenções arquiteturais que o código não expressa. Como discutimos antes, ler o comportamento emergente de um sistema é útil, mas não substitui a especificação de design.

Ainda assim, a leitura sobrevive ao contrapeso. Se o agente mais respeitado do mercado é, no núcleo, um while, então a pergunta que importa para as equipes que operam agentes não é “como fazemos um motor melhor?”. É “como fazemos um perímetro melhor?”.

A resposta dessa pergunta não é arquitetural. É organizacional. Envolve políticas de ferramentas, disciplina de prompts, desenho de checkpoints, revisão de logs, definição clara de quem aprova o quê. É trabalho de governança, não de engenharia de IA.

E é aí que a maioria das equipes ainda está no escuro.

Fontes

Liu, J., Zhao, X., Shang, X., Shen, Z. “Dive into Claude Code: The Design Space of Today’s and Future AI Agent Systems.” arXiv:2604.14228, abril 2026.

Ajudamos equipes a tratar o perímetro do agente, ferramentas, prompts e checkpoints, como superfície de governança: contato@victorino.com.br | www.victorino.com.br