Código Barato, Qualidade Cara

Simon Willison publicou o primeiro capítulo do seu guia Agentic Engineering Patterns em 23 de fevereiro de 2026. O título diz tudo: “Writing code is cheap now” — escrever código é barato agora.

O co-criador do Django não está fazendo previsão. Está descrevendo um fato consumado. Agentes de codificação, nas palavras dele, “reduziram drasticamente o custo de digitar código no computador.” Algumas centenas de linhas de código limpo e testado costumavam custar um dia inteiro de trabalho. Agora custam um prompt e dez minutos de espera.

Mas Willison imediatamente segue com a frase que importa mais: “Entregar código novo caiu para quase gratuito… mas entregar bom código continua significativamente mais caro que isso.”

Este é o enquadramento econômico mais preciso do momento atual no desenvolvimento assistido por IA. E leva diretamente a um problema de governança que a maioria das organizações ainda não reconheceu.

O Que “Bom” Realmente Custa

Willison define bom código através de uma lista que funciona como uma auditoria involuntária de tudo que IA não consegue verificar de forma barata:

Correção funcional sem bugs
Confirmação verificada de adequação ao propósito
Resolve o problema certo
Tratamento gracioso de erros com mensagens informativas
Simples e mínimo
Cobertura abrangente de testes
Documentação atual e precisa
Preparado para mudanças futuras respeitando YAGNI
Qualidades não-funcionais: acessibilidade, testabilidade, confiabilidade, segurança, manutenibilidade, observabilidade, escalabilidade, usabilidade

Leia essa lista de novo. Cada item exige julgamento humano. “Resolve o problema certo” requer entender qual é o problema certo. “Preparado para mudanças futuras” requer saber quais mudanças estão por vir. “Simples e mínimo” requer reconhecer quando o código faz demais — o que exige compreender o sistema onde ele vive.

Um agente de codificação pode gerar código que passa nos testes. Não pode determinar se os testes testam as coisas certas. Pode produzir documentação. Não pode avaliar se a documentação corresponde ao que o código realmente faz em produção. Pode implementar tratamento de erros. Não pode julgar se as mensagens de erro fazem sentido para os humanos que vão lê-las às 3h da manhã durante um incidente.

A distância entre “produz código” e “entrega bom código” não é uma lacuna de ferramentas. É uma lacuna de julgamento. E julgamento é a única coisa que não ficou mais barata.

A Armadilha Individual

A recomendação prática de Willison é caracteristicamente pragmática: “toda vez que seu instinto disser ‘não vale a pena construir isso’, lance um prompt mesmo assim, numa sessão assíncrona de agente onde o pior que pode acontecer é você verificar dez minutos depois e descobrir que não valeu os tokens.”

Para um desenvolvedor individual — especialmente um tão experiente quanto Willison — isso funciona. Você gera barato, avalia com expertise, descarta o que não funciona. O custo de exploração caiu para quase zero. O custo de avaliação permanece constante, mas se amortiza contra mais opções.

O problema aparece na escala organizacional.

Quando todos os desenvolvedores de uma organização podem gerar código a custo quase zero, o volume de código exigindo avaliação se multiplica. Filas de revisão crescem. Conflitos de merge aumentam. Testes de integração se tornam o gargalo. A organização tornou a parte barata mais barata e congestionou a parte cara.

A análise da LinearB de 8,1 milhões de pull requests descobriu que PRs gerados por IA tinham taxa de aceitação de 32,7% versus 84,4% para escritos manualmente. Essa é a lacuna de qualidade expressa em dados operacionais. O código está sendo gerado. Não está sendo aceito. O gargalo se moveu exatamente para onde o framework de Willison prevê — para a verificação.

O Governador Que Desapareceu

Aqui está o insight que o enquadramento de Willison possibilita mas não explicita: quando código era caro de produzir, o custo em si funcionava como um governador natural.

Você pensava antes de codificar porque codificar consumia tempo. Você projetava antes de implementar porque implementação era o recurso escasso. Você não construía funcionalidades desnecessárias porque construir era custoso. O custo de produção impunha disciplina.

Esse governador sumiu.

Quando produção é quase gratuita, cada impulso vira um pull request. Cada ideia vira um protótipo. Cada pensamento paralelo vira uma branch. O codebase se expande não porque a organização precisa de mais código, mas porque produzir mais código não tem mais fricção natural.

A pesquisa State of Code 2026 da Sonar, com 1.149 desenvolvedores, encontrou que 96% não confiam na precisão de código IA. Não é ceticismo irracional — é a resposta racional a um sistema que gera artefatos mais rápido do que qualquer pessoa pode verificá-los. Os desenvolvedores estão dizendo: o governador desapareceu, e nada o substituiu.

O Que Substitui o Governador

Willison traça a linha entre “engenharia agêntica” — profissionais usando agentes com padrões de qualidade — e “vibe coding” — gerar código sem atenção à qualidade. Essa é a distinção certa, mas ele a enquadra como escolha individual.

No nível organizacional, a distinção é governança.

As organizações que terão sucesso com desenvolvimento assistido por IA não são as que geram mais código. São as que constroem infraestrutura de verificação proporcional à sua capacidade de geração. Isso significa:

Portões de qualidade que escalam com o volume. Se seus desenvolvedores podem gerar 10x mais código, seu processo de revisão precisa lidar com 10x mais avaliações — seja por automação (sistemas de tipos, análise estática, funções de fitness arquitetural) ou por triagem mais inteligente (revisão por nível de risco, aceitação baseada em especificação).

Avaliação como disciplina de primeira classe. Não um pensamento posterior. Não “alguém vai revisar.” Uma prática sistemática com equipe, ferramentas e métricas. A lista de “bom código” de Willison é a especificação. A organização precisa da infraestrutura operacional para verificar contra ela.

Contabilidade de custos que inclui verificação. O custo de tokens para gerar código é quase zero. O custo organizacional de avaliar, integrar, manter e eventualmente depreciar esse código, não é. Qualquer cálculo de produtividade com IA que mede output sem medir o custo de verificação está mentindo para si mesmo.

Willison está certo que código é barato. As organizações que tratam qualidade como igualmente barata vão aprender a diferença em produção.

Esta análise é baseada no artigo de Simon Willison “Writing code is cheap now” (23 de fevereiro de 2026), capítulo de abertura do guia Agentic Engineering Patterns, com dados de suporte dos benchmarks de engenharia 2026 da LinearB e da pesquisa State of Code 2026 da Sonar.

A Victorino Group ajuda equipes de engenharia a construir a infraestrutura de verificação que torna código barato confiável. O problema não é que IA escreve código demais. O problema é que sua organização não tem sistema para determinar quanto dele é bom. Vamos resolver isso.

O Que “Bom” Realmente Custa

A Armadilha Individual

O Governador Que Desapareceu

O Que Substitui o Governador

Se isso faz sentido, vamos conversar