Quem Decide de Fato Quando Você Constrói Com um Agente de Código

TV
Thiago Victorino
7 min de leitura
Quem Decide de Fato Quando Você Constrói Com um Agente de Código

Humanos tomam cerca de 70% das decisões de planejamento em uma sessão com agente de código, e o agente toma cerca de 80% das decisões de execução. Esse número vem da análise da Anthropic sobre aproximadamente 400 mil sessões do Claude Code, entre 235 mil usuários e 23 grupos ocupacionais, conduzida de outubro de 2025 a abril de 2026. É a primeira medição de larga escala, em dados de primeira mão, de quem decide o quê quando uma pessoa constrói software com um agente. A manchete não é que o agente escreve o código. Isso todo mundo já sabia. A manchete é que a fronteira de decisão é nítida, estável e cai exatamente onde a responsabilidade deveria estar: o humano é dono do quê, o agente é dono do como.

Já argumentamos que a expertise de domínio é a variável de controle que ninguém mede e que a camada de verificação é o que separa output de competência. Aquilo eram afirmações. A Anthropic acabou de pôr números atrás delas, em uma escala que nenhum time isolado conseguiria reproduzir.

A Divisão 70/30 É Uma Descrição de Cargo

“As pessoas decidem o que construir, e o agente decide como construir.” Essa frase da Anthropic Economic Research soa como slogan até você vê-la sustentada por 400 mil sessões. Decisões de planejamento: escopo, sequenciamento, qual problema resolver, qual tradeoff aceitar, quando o trabalho está pronto. Humanos conduzem cerca de 70% delas. Decisões de execução: qual assinatura de função, qual chamada de biblioteca, como estruturar o loop, qual caso de borda tratar inline. O agente conduz cerca de 80% dessas.

Leia isso como um organograma. O humano dirige a execução, sentado na cadeira do diretor. O agente é um engenheiro rápido e capaz que precisa de um brief claro e de um revisor responsável. Nenhum dos dois papéis é opcional. Uma sessão em que o humano abdica do planejamento produz software bem construído resolvendo o problema errado. Uma sessão em que o humano microgerencia a execução desperdiça a única coisa em que o agente é de fato bom.

O reenquadramento mais útil aqui é operacional. Se você está montando um time para construir com agentes, não está contratando por velocidade de digitação. Está contratando pelos 70%: gente que sabe decidir o que construir e reconhecer quando está construído corretamente. Isso é uma entrevista diferente, um scorecard diferente e uma definição de senioridade diferente da que a maioria das engenharias roda hoje.

Expertise Prevê Sucesso, Habilidade de Código Não

O achado que deveria reorganizar planos de contratação: toda ocupação relevante fica dentro de 7 pontos percentuais dos engenheiros de software na taxa de sucesso. Um analista financeiro, um biólogo, um profissional de marketing, um advogado construindo uma ferramenta no Claude Code têm sucesso a uma taxa próxima à de um engenheiro de software treinado fazendo o mesmo. A variável que move o número não é se você sabe programar. É se você entende o problema.

A Anthropic é direta: “O sucesso é determinado por quão bem a pessoa entende o problema que está tentando resolver, não por ela ter ou não formação em programação.” Os dados embaixo têm textura. Sucesso verificado roda em 15% para novatos e 28% a 33% para intermediários e experts. Sucesso parcial sobe de 77% para novatos a 91% ou 92% para experts. A vantagem do expert é real e ela se acumula, mas acompanha o domínio da área, não a fluência em sintaxe.

É por isso que o argumento do imposto de expertise que fizemos sobre biologia espacial generaliza. O imposto é o mesmo em todo campo. Um não-programador com conhecimento profundo de domínio passa na barra. Um bom programador trabalhando fora de seu domínio não ganha passe livre. O agente derruba o custo de escrever código para perto de zero, o que expõe o custo que sempre foi o gargalo real: saber como o correto se parece.

O Comportamento Muda Com o Domínio

Sessões de novatos têm em média 5 ações do Claude por prompt. Sessões de experts têm em média 12 ou mais. O expert não está sendo mais cauteloso. O expert está entregando ao agente unidades de trabalho maiores e mais bem especificadas, confiando que ele corra mais longe antes de prestar contas. Isso é delegação calibrada por julgamento, e só vem de conhecer o problema bem o bastante para escrever um brief que o agente executa sem coleira.

As linhas de tendência ao longo da janela do estudo contam o resto. Sessões de depuração caíram de 33% para 19%. O valor das tarefas subiu cerca de 25% em sete meses. Os usuários subiram na cadeia de valor: menos tempo consertando o que o agente quebrou, mais tempo direcionando-o a trabalho que importava. Essa mudança não veio só do modelo. Veio de usuários aprendendo onde fica a linha 70/30 e parando de brigar com ela.

O Que Isto Não Prova

A Anthropic é franca quanto aos limites, e nós também devemos ser. Os classificadores que produziram esses números não conseguem validar resultados no mundo real, e o time não consegue verificar a acurácia dos classificadores em escala total. A divisão 70/30 mede atribuição de decisão; ela não comprova causalidade. “Expertise prevê sucesso” descreve uma correlação forte em uma amostra muito grande, sem o rigor de um ensaio controlado. Trate os números como o melhor mapa que temos do trabalho assistido por agente, traçado a partir do maior conjunto de dados de primeira mão publicado até hoje, e trate a direção como mais confiável do que qualquer casa decimal isolada.

Essa ressalva não suaviza a leitura estratégica. Mesmo descontado o ruído dos classificadores, um achado que se sustenta em 23 ocupações e 235 mil usuários não é artefato. A fronteira está lá.

Faça Isto Agora

Audite o trabalho com agentes de um time contra a linha 70/30. Pegue um projeto recente construído com agente de código e faça duas perguntas. Primeira: quem tomou as decisões de planejamento, escopo, sequenciamento, definição de pronto? Se a resposta for “o agente decidiu e a gente aceitou”, sua responsabilidade está invertida e seu raio de impacto é maior do que você imagina. Segunda: quem direcionou o agente tinha domínio real do problema, ou só domínio da ferramenta? Se você montou o time por fluência em ferramenta, otimizou pelos 20% que o agente já é dono e subcomprou os 70% que decidem se o output está correto.

Depois mude uma coisa na sua próxima contratação ou decisão de alocação. Pese domínio da área acima de pedigree de programação para o papel de diretor, e torne alguém explicitamente responsável pelos 70% do planejamento. O agente cuida dos 80% da execução. Seu trabalho é garantir que um humano que entende o problema esteja segurando a outra ponta.


Fontes

A Victorino ajuda equipes a transformar adoção de agentes em entrega medida e responsável: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa