Notas de Engenharia

As ferramentas mudam rápido. Os princípios de engenharia que tornam a IA governável, não.

50 artigos

Ensaios

Ensaio
Quatro Meses, Um Tipo Array no Redis e o Que Isso Diz Sobre IA em Código de Produção
Salvatore Sanfilippo passou quatro meses construindo um tipo Array no Redis com IA. A disciplina que ele descreve é a tese do harness na prática.
May 5, 20266 min de leitura Read more
Ensaio
Sobrecarga de Ferramentas Tem Imposto: Quando 50 MCPs Comem 7% do Contexto
Com 50+ ferramentas MCP, schemas comem 5–7% do contexto antes do usuário digitar. Code Mode é resposta. Governabilidade é a pergunta.
Apr 29, 20266 min de leitura Read more
Ensaio
Três Padrões de Memória que Funcionam (e Dois que Não)
A taxonomia de memória de agentes de Tim Kellogg, com um número operacional para governar. Blocos de memória acima de 500 caracteres confundem o agente.
Apr 29, 20266 min de leitura Read more
Ensaio
O núcleo de um agente de ponta é um while
Análise arquitetural do Claude Code mostra que o motor do agente é um laço simples. A complexidade, e a governança, vive no perímetro.
Apr 21, 20265 min de leitura Read more
Ensaio
O que mudou no system prompt do Opus 4.7 é referência de governança
Simon Willison publicou o diff do system prompt do Opus 4.7. O que esse artefato ensina sobre governança auditável de camada de prompt.
Apr 21, 20265 min de leitura Read more
Ensaio
MCP 2026: a pilha de conectividade em três camadas
O co-criador do MCP acaba de descrever a arquitetura de conectividade para 2026. Procurement precisa de uma nova matriz.
Apr 21, 20268 min de leitura Read more
Ensaio
Screenshots São Engenharia de Contexto Preguiçosa
A Callstack cortou 50% do consumo de tokens sem trocar de modelo. Só trocou screenshots por contexto deliberado. Essa é a governança de custo mais barata.
Apr 15, 20265 min de leitura Read more
Ensaio
Kernels Multi-Agente da Cursor: o Que um Time de Agentes Medido se Parece
Cursor otimizou 235 kernels CUDA com um sistema multi-agente e publicou ganho médio de 38%. A disciplina de medição importa mais que o número.
Apr 15, 20265 min de leitura Read more
Ensaio
A Revisão de Código por IA Define Seus Próprios Padrões. Quem Revisa o Revisor?
BugBot alcança 78% de resolução com 44K regras autônomas. Claude exige configuração humana. Mesma pergunta, duas respostas.
Apr 9, 20269 min de leitura Read more
Ensaio
Meta-Harness: Quando Máquinas Otimizam a Camada de Governança
Stanford e MIT criaram um sistema que otimiza harnesses automaticamente. Se harnesses são governança, quem governa o otimizador?
Apr 6, 20267 min de leitura Read more
Ensaio
Um Pesquisador da Anthropic Encontrou Bugs de 23 Anos no Kernel Linux. O Problema Não É o Bug.
Claude Code achou vulnerabilidades que humanos não encontraram em décadas. A questão de governança: quem mais pode fazer isso?
Apr 6, 20268 min de leitura Read more
Ensaio
27% das Fontes do ChatGPT Aparecem no Google. Isso É Problema de Governança.
Novos dados: 60% das citações do ChatGPT não aparecem nos resultados de busca. Organizações não governam visibilidade de IA como SEO.
Apr 1, 20269 min de leitura Read more
Ensaio
Workload-Harness Fit: A Taxonomia de Governança Escondida nos Agent Labs
Labs de agentes estão treinando modelos próprios. A decisão de quando treinar revela um framework de governança com quatro dimensões.
Apr 1, 20269 min de leitura Read more
Ensaio
De 6,75% Para 99,8%: O Que Verificação Com Restrições de Tipo Entrega
Um harness com restrições de tipo transformou 6,75% de sucesso em chamadas de função do Qwen em 99,8%. O custo do harness é negativo.
Mar 30, 20268 min de leitura Read more
Ensaio
O Que É uma Agentic Mesh? A Camada de Infraestrutura Que Falta no Seu Sistema Multiagente
Agentic mesh conecta agentes de IA isolados em uma rede governada. A maioria das organizações precisa. Poucas sabem que existe.
Mar 28, 202610 min de leitura Read more
Ensaio
O Que É um Agent Harness? O Conceito Que Falta na Sua Estratégia de IA
Agent harness é a infraestrutura que envolve seu modelo de IA. Mesmo modelo, harness diferente, 85% mais resultados.
Mar 26, 20269 min de leitura Read more
Ensaio
Gerar, Avaliar, Repetir: O Que Agentes de Longa Duração Exigem do Harness
Anthropic publicou dados empíricos sobre harness para aplicações longas. Os custos, os padrões e as falhas revelam mais do que pretendem.
Mar 24, 202610 min de leitura Read more
Ensaio
Seu Prompt de 'IA Especialista' Está Deixando Sua IA Mais Burra
Pesquisa da USC: prompts de persona expert reduzem precisão em 3,6pp e aumentam segurança em 17,7pp. A solução é roteamento, não remoção.
Mar 24, 20269 min de leitura Read more
Ensaio
O mercado escolheu governança: o que os dados de gastos da Ramp revelam sobre confiança de marca
Dados de gastos corporativos da Ramp mostram Anthropic saltando de 4% para 24,4% em um ano. OpenAI registrou seu maior declínio. Por quê?
Mar 20, 20267 min de leitura Read more
Ensaio
A Crise do Contexto: Três Apostas Que Encolhem o Mundo do Agente Para Fazê-lo Funcionar
Uma equipe queimou 72% do contexto em definições de ferramentas. Três soluções independentes convergem no mesmo princípio.
Mar 19, 20269 min de leitura Read more
Ensaio
O Que Centenas de Skills em Produção Ensinam Sobre Engenharia de Agentes
Lições de um insider da Anthropic sobre skills em escala: verificação supera geração, contexto verboso degrada, e governança exige pipeline.
Mar 18, 20269 min de leitura Read more
Ensaio
MCP Morreu; Vida Longa ao MCP — Por Que o Debate CLI vs Protocolo Erra o Alvo
CLIs economizam tokens para indivíduos. MCP vence para empresas. A pergunta real não é qual é melhor, mas quem está perguntando.
Mar 17, 20269 min de leitura Read more
Ensaio
A Diferença do Harness: Quando 42% Vira 78% Sem Trocar o Modelo
Mesmo modelo, mesmo benchmark. Claude Opus 4.5 marcou 42% e 78% dependendo do harness. O modelo não é o produto.
Mar 5, 202610 min de leitura Read more
Ensaio
Ver Como um Agente: O Que o Design de Ferramentas do Claude Code Revela
A equipe do Claude Code compartilha 4 lições de design de ferramentas. Evidência de primeira mão: ferramentas moldam comportamento de agentes.
Mar 3, 202610 min de leitura Read more
Ensaio
O Que 1,2 Milhão de Respostas do ChatGPT Revelam Sobre Padrões de Citação de LLMs
Separando sinal verificado de ruído de marketing no campo emergente de Generative Engine Optimization.
Feb 23, 202610 min de leitura Read more
Ensaio
Arquitetura Multiagente: O Que Erlang, VS Code e um Loop dos Simpsons Revelam
Erlang resolveu orquestração de agentes em 1986. Quatro sinais convergentes mostram a indústria redescobrindo supervisão e isolamento.
Feb 20, 202612 min de leitura Read more
Ensaio
Composition-RL: Quando Compor Vale Mais que Escalar
Mais dados não melhoram seu modelo. Composition-RL mostra que compor problemas simples supera escalar dados — e modelos menores vencem maiores.
Feb 16, 202610 min de leitura Read more
Ensaio
WebMCP: Todo Site Acaba de Virar Ferramenta para Agentes de IA
O novo padrão WebMCP do Chrome permite que sites exponham ferramentas estruturadas para agentes de IA.
Feb 12, 20268 min de leitura Read more
Ensaio
O Que o Agent Loop do Codex Revela Sobre Construir Agentes de IA em Produção
Uma dissecação da arquitetura open-source de agentes da OpenAI e o que isso significa para times de engenharia.
Feb 4, 202610 min de leitura Read more
Ensaio
O Comando /insights do Claude Code: Auto-Análise de Sessões com IA
Como o pipeline de análise qualitativa do /insights transforma logs de sessão em inteligência acionável para desenvolvedores.
Feb 4, 20268 min de leitura Read more
Ensaio
O Exame Que a IA Aposentou — e o Que Isso Revela Sobre Governança
O take-home da Anthropic mostra que IA otimiza rápido, mas não profundo. A lição real está na governança, não na velocidade.
Feb 4, 20268 min de leitura Read more
Ensaio
Contexto Passivo Vence: Por Que AGENTS.md Supera Skills em Avaliações de Agentes de IA
Estudo da Vercel: 100% de aprovação com AGENTS.md vs 53% para skills. O problema: agentes nunca invocavam os skills.
Jan 29, 202610 min de leitura Read more
Ensaio
Claude + FigJam: Quando Outputs de IA Param de Morrer em Logs de Chat
Conversas com IA geram insights que ficam presos em logs de chat. Integração FigJam cria artefatos compartilháveis.
Jan 28, 202610 min de leitura Read more
Ensaio
Como Construir Agentes de Código Autoaperfeiçoantes
Se você repete as mesmas instruções toda sessão, não está desenvolvendo com IA. Aprenda a criar sistemas que aprendem com cada interação.
Jan 22, 202612 min de leitura Read more
Ensaio
Code Review com IA: Lições do Cursor BugBot
Como o BugBot evoluiu de pipeline estático para agente autônomo e o que times de engenharia podem aprender sobre DevEx com IA.
Jan 22, 202612 min de leitura Read more
Ensaio
Context Engineering para Agentes de IA: Lições do Azure e Manus
Como gerenciar contexto em sistemas agênticos de produção. Sete lições do Azure SRE Agent e técnicas avançadas do Manus.
Jan 22, 202614 min de leitura Read more
Ensaio
FastMCP 3.0: A Nova Arquitetura para Servidores MCP de Produção
FastMCP 3.0 reconstrói o framework ao redor de três primitivos fundamentais. Entenda Components, Providers e Transforms para enterprise.
Jan 22, 202614 min de leitura Read more
Ensaio
MCP Design Patterns: Construindo Servidores que Agentes Realmente Conseguem Usar
97 milhões de downloads mensais. Também culpado por agentes que alucinam. O problema não é o protocolo - é o design do seu servidor.
Jan 22, 202612 min de leitura Read more
Ensaio
CLAUDE.md: O Manual de Instruções do Seu Assistente de Código
Guia prático para criar um CLAUDE.md eficiente. Melhores praticas, estrutura, exemplos e erros comuns ao configurar o Claude Code.
Jan 19, 202612 min de leitura Read more
Ensaio
Claude Cowork: Quando a IA Finalmente Trabalha ao Seu Lado
Anthropic lança Claude Cowork: automação agêntica para todos. Análise técnica, casos de uso reais e o que funciona de verdade.
Jan 13, 20269 min de leitura Read more

Notas de Engenharia

Ensaios

Quatro Meses, Um Tipo Array no Redis e o Que Isso Diz Sobre IA em Código de Produção

Sobrecarga de Ferramentas Tem Imposto: Quando 50 MCPs Comem 7% do Contexto

Três Padrões de Memória que Funcionam (e Dois que Não)

O núcleo de um agente de ponta é um while

O que mudou no system prompt do Opus 4.7 é referência de governança

MCP 2026: a pilha de conectividade em três camadas

Screenshots São Engenharia de Contexto Preguiçosa

Kernels Multi-Agente da Cursor: o Que um Time de Agentes Medido se Parece

A Revisão de Código por IA Define Seus Próprios Padrões. Quem Revisa o Revisor?

Meta-Harness: Quando Máquinas Otimizam a Camada de Governança

Um Pesquisador da Anthropic Encontrou Bugs de 23 Anos no Kernel Linux. O Problema Não É o Bug.

27% das Fontes do ChatGPT Aparecem no Google. Isso É Problema de Governança.

Workload-Harness Fit: A Taxonomia de Governança Escondida nos Agent Labs

De 6,75% Para 99,8%: O Que Verificação Com Restrições de Tipo Entrega

O Que É uma Agentic Mesh? A Camada de Infraestrutura Que Falta no Seu Sistema Multiagente

O Que É um Agent Harness? O Conceito Que Falta na Sua Estratégia de IA

Gerar, Avaliar, Repetir: O Que Agentes de Longa Duração Exigem do Harness

Seu Prompt de 'IA Especialista' Está Deixando Sua IA Mais Burra

O mercado escolheu governança: o que os dados de gastos da Ramp revelam sobre confiança de marca

A Crise do Contexto: Três Apostas Que Encolhem o Mundo do Agente Para Fazê-lo Funcionar

O Que Centenas de Skills em Produção Ensinam Sobre Engenharia de Agentes

MCP Morreu; Vida Longa ao MCP — Por Que o Debate CLI vs Protocolo Erra o Alvo

A Diferença do Harness: Quando 42% Vira 78% Sem Trocar o Modelo

Ver Como um Agente: O Que o Design de Ferramentas do Claude Code Revela

O Que 1,2 Milhão de Respostas do ChatGPT Revelam Sobre Padrões de Citação de LLMs

Arquitetura Multiagente: O Que Erlang, VS Code e um Loop dos Simpsons Revelam

Composition-RL: Quando Compor Vale Mais que Escalar

WebMCP: Todo Site Acaba de Virar Ferramenta para Agentes de IA

O Que o Agent Loop do Codex Revela Sobre Construir Agentes de IA em Produção

O Comando /insights do Claude Code: Auto-Análise de Sessões com IA

O Exame Que a IA Aposentou — e o Que Isso Revela Sobre Governança

Contexto Passivo Vence: Por Que AGENTS.md Supera Skills em Avaliações de Agentes de IA

Claude + FigJam: Quando Outputs de IA Param de Morrer em Logs de Chat

Como Construir Agentes de Código Autoaperfeiçoantes

Code Review com IA: Lições do Cursor BugBot

Context Engineering para Agentes de IA: Lições do Azure e Manus

FastMCP 3.0: A Nova Arquitetura para Servidores MCP de Produção

MCP Design Patterns: Construindo Servidores que Agentes Realmente Conseguem Usar

CLAUDE.md: O Manual de Instruções do Seu Assistente de Código

Claude Cowork: Quando a IA Finalmente Trabalha ao Seu Lado

Pontos de Vista

Notas do Cloud Next 2026: Por Que Seu Agente Precisa de um Grafo de Contexto

Sete Horas de IA, Uma Semana de Verificação

O Que a Camada Agêntica da Stripe Revela Sobre o Próximo Paradigma de Engenharia

Harness Engineering Não É Novo — Mas Nomeá-lo Importa

Agentes Não São Ferramentas — Mas Às Vezes Deveriam Ser

IA Contínua: O Que os Agentic Workflows do GitHub Realmente Mudam

A Convergência de 5 de Fevereiro: O Que GPT-5.3-Codex e Opus 4.6 Revelam

Code Smells para Agentes de IA: A Infraestrutura que Você Já Tem É a Governança que Faltava

Contexto É o Novo Perímetro: Por Que Governança de Agentes IA Começa na Janela de Contexto

DeepSeek mHC: Como uma Técnica de 1967 Está Reinventando Redes Neurais

Explore Outras Perspectivas

O Problema do Controle de IA

Implementação Governada

Operando IA

Agende uma Discussão Técnica