Infraestrutura de Agentes Governada em Escala: KernelEvolve e AWS DevOps Agent

Dois anúncios chegaram na mesma semana. A Meta publicou o KernelEvolve, um agente de IA que gera e otimiza kernels de hardware de forma autônoma em plataformas NVIDIA, AMD, MTIA e CPUs. A AWS anunciou a disponibilidade geral do DevOps Agent — o primeiro produto de SRE autônomo de um grande provedor de nuvem.

Nenhum dos dois é demonstração. Ambos rodam em produção. E ambos incorporam governança tão profundamente em sua arquitetura que removê-la quebraria o sistema.

Esse é o padrão que vale examinar.

KernelEvolve: Avaliação Como Arquitetura Inteira

O KernelEvolve não gera kernels. Ele busca kernels. A distinção importa porque determina onde a governança vive.

Uma abordagem de geração única produziria um kernel, executaria e torceria pelo melhor. O KernelEvolve trata otimização como problema de busca: gera candidatos, perfila em múltiplos níveis, alimenta informação diagnóstica de volta no próximo ciclo de geração e repete até que restrições de corretude e desempenho sejam satisfeitas.

Os resultados validam a abordagem. No modelo de ranking de anúncios Andromeda da Meta, o KernelEvolve alcançou 60% de melhoria no throughput de inferência em GPUs NVIDIA e 25% de melhoria no throughput de treinamento no silício MTIA da própria Meta. Obteve 100% de aprovação no KernelBench, um conjunto de 250 problemas de otimização de kernels. E manteve 100% de corretude em 160 operadores PyTorch ATen validados em três plataformas de hardware — 480 configurações no total.

Ciclos de desenvolvimento comprimiram de semanas para horas. O artigo foi aceito no ISCA 2026, a principal conferência de arquitetura de computadores. Doze engenheiros da Meta — incluindo Gang Liao, Yavuz Yetim, Chunqiang Tang e Carole-Jean Wu — contribuíram para o trabalho.

O que torna isso uma história de governança e não de desempenho é o perfilamento multinível com ciclos de feedback diagnóstico. O agente não apenas executa código e verifica se há falha. Ele instrumenta a execução em múltiplas granularidades, compara contra baselines, identifica onde o desempenho degrada e usa esse sinal diagnóstico estruturado para guiar a próxima iteração. O ciclo de feedback não é acoplado depois. É o mecanismo pelo qual o agente raciocina.

Isso é o que descrevemos em desenvolvimento orientado por avaliação levado ao extremo lógico: avaliação não é um portão de qualidade pelo qual o agente passa. É o substrato sobre o qual o agente pensa.

AWS DevOps Agent: SRE Autônomo Produtizado

O AWS DevOps Agent ocupa uma parte diferente da pilha mas incorpora o mesmo princípio. Ele lida com resolução autônoma de incidentes, prevenção proativa e automação de tarefas de SRE. A AWS reporta redução do MTTR de horas para minutos.

Os mecanismos de governança diferem na implementação mas são idênticos em filosofia. Skills customizadas definem o que o agente pode fazer. Integração com relatórios provê visibilidade sobre o que o agente fez. Integração com CI/CD restringe onde o agente opera. Suporte multicloud e on-premises significa que a fronteira de governança se estende por ambientes em vez de ficar limitada a uma única nuvem.

Esse é o primeiro produto de SRE autônomo em disponibilidade geral de um grande provedor de nuvem. “Disponibilidade geral” é a frase operativa. O gap de infraestrutura entre demonstrações de agentes e operações de agentes já foi documentado. A AWS fechar esse gap com um produto geralmente disponível — não um preview, não um beta — sinaliza que o mercado considera autonomia de agentes governada pronta para cargas de trabalho de produção.

O Padrão: Governança Como Restrição de Busca, Não Verificação Posterior

Ambos os sistemas compartilham um insight estrutural que os separa do trabalho de agentes em estágio de demonstração que cobrimos em operações empresariais de agentes.

Em agentes de estágio demonstrativo, governança é um filtro aplicado depois que o agente age. O agente gera saída. Um sistema separado verifica a saída. Se a verificação falha, a saída é rejeitada ou reprocessada.

No KernelEvolve e no AWS DevOps Agent, governança é uma restrição que molda como o agente busca soluções. O feedback de perfilamento do KernelEvolve não rejeita kernels ruins depois de gerados. Ele direciona o processo de geração em direção a candidatos corretos e performantes. As definições de skills do AWS DevOps Agent não auditam ações após execução. Elas definem o espaço de ação dentro do qual o agente opera.

A diferença não é filosófica. É arquitetural. Governança posterior escala linearmente com volume de saída — cada saída precisa de verificação. Governança como restrição de busca escala com a definição do espaço de restrições, que muda infrequentemente.

O Que Isso Significa Para Decisões de Infraestrutura de Agentes

Organizações construindo infraestrutura de agentes enfrentam uma decisão de design que esses dois sistemas tornam concreta.

Opção um: construir agentes que agem livremente e governá-los com monitoramento e rollback. Esse é o padrão para o qual a maioria das equipes gravita porque é mais simples de começar. O agente faz seu trabalho; você observa e intervém quando algo sai errado.

Opção dois: construir agentes cujo processo de raciocínio é estruturado por avaliação. O agente não produz saídas e espera aprovação. O processo de busca do agente é restringido por critérios de corretude, feedback de perfilamento e limites de ação definidos.

O KernelEvolve demonstra que a opção dois funciona para otimização de desempenho em nível de hardware — um domínio onde saída incorreta não é apenas custosa mas perigosa (corrupção silenciosa de dados, dano a hardware em escala). O AWS DevOps Agent demonstra que a opção dois é comercialmente viável como serviço gerenciado em infraestrutura heterogênea.

A validação de 100% de corretude em 480 configurações não é uma métrica de qualidade. É uma métrica de governança. Significa que o pipeline de avaliação do sistema é abrangente o suficiente para que nenhum kernel incorreto escapou para produção em três plataformas de hardware e 160 tipos de operadores.

O Pipeline de Avaliação É o Produto

Retire o pipeline de avaliação do KernelEvolve e você tem um agente de geração de código que às vezes produz kernels rápidos e às vezes produz kernels incorretos. Retire as definições de skills e os relatórios do AWS DevOps Agent e você tem uma ferramenta de automação que às vezes corrige incidentes e às vezes os cria.

A camada de governança não é overhead. É o mecanismo que torna operação autônoma viável. Essa é a tese de desenvolvimento orientado por avaliação confirmada por sistemas em produção na escala de Meta e AWS: infraestrutura de avaliação não é centro de custo. É o produto.

Para equipes planejando investimentos em infraestrutura de agentes, a implicação é direta. Orçe infraestrutura de avaliação e governança pelo menos tanto quanto para as capacidades dos agentes em si. O agente que gera candidatos é commodity. O pipeline de avaliação que garante que apenas candidatos corretos são entregues é a vantagem competitiva.

Esta análise baseia-se na publicação KernelEvolve da Meta Engineering (2 de abril de 2026, artigo aceito no ISCA 2026) e no anúncio de disponibilidade geral do AWS DevOps Agent (31 de março de 2026).

O Victorino Group ajuda organizações a projetar infraestrutura de agentes onde governança é arquitetural, não improviso. Vamos conversar.