Cinco Níveis de Contenção do Bash: Por Que Engenheiros Sêniores Deletam a Ferramenta
Do prompt como lei ao bash zero. Risco se acumula com o tempo de execução. A escada de cinco níveis transforma esperança em decisão de permissionamento.
Velocidade e segurança não são opostos. São parceiros quando a governança é integrada.
124 artigos
Do prompt como lei ao bash zero. Risco se acumula com o tempo de execução. A escada de cinco níveis transforma esperança em decisão de permissionamento.
Computação, dados, conhecimento, identidade. Quatro superfícies de controle de agentes ganharam implementações de referência na mesma semana.
De assistentes virtuais a carros autônomos, agentes de IA estão em toda parte. Conheça a arquitetura Sentir-Pensar-Agir.
Por que dois terços das organizações estão presas no purgatório do piloto, e como fazer parte dos 8,6% que chegam à produção.
A plataforma agêntica da Bayer mostra que confiabilidade é estrutural: o agente não consegue rodar uma query destrutiva. O controle vive no harness.
A Elastic reporta 0,89 de recall e zero vazamento entre tenants colocando o isolamento da memória no banco de dados, não no prompt.
RL focado só em tarefa elevou o vazamento de dados de 34% para 51,7%. Otimizar para sucesso faz o agente vazar mais, não menos. Por que prompts falham.
A Anthropic mediu 400 mil sessões do Claude Code: humanos tomam 70% das decisões de planejamento, o agente 80% das de execução. Expertise prevê sucesso.
O Vercel Connect troca tokens armazenados por credenciais curtas e escopadas pedidas em tempo de execução. O agente nunca segura um segredo que valha roubar.
A Dropbox construiu um sistema agêntico que compara o modelo de ameaças com o PR dentro do loop de revisão, expondo falhas que a análise estática não vê.
Janelas de contexto anunciadas são número de marketing. A atenção efetiva cai perto de 100k tokens. A resposta governada é arquitetura, não janela maior.
O Open Knowledge Format do Google Cloud torna o conhecimento interno um contrato markdown portável. A leitura de governança sobre aprisionamento.
A Anthropic lançou orquestração como código e a PwC provou que o harness move a acurácia em 16 pontos. O controle vive no código, não no prompt.
Três pilares multiplicam a velocidade de entrega. Só a governança escala a revisão que mantém a entrega segura. A verificação é o novo gargalo.
A Anthropic lançou um modelo atrás de dois portões de governança: roteamento de risco e níveis de identidade. Essa é a arquitetura a copiar.
O SchemaFlow da OpenAI mostra IA governada na camada de dados: cinco agentes que rascunham, analisam e validam, mas nunca executam SQL.
Osmani nomeia a dívida de intenção como a terceira perna do modelo de Storey. Agentes pagam a técnica e a cognitiva, mas nunca esta. Só o humano paga.
Runtime de linguagem, microVM, egress de rede, gateway. Isolamento de agentes em quatro camadas numa semana. A questão é onde traçar a fronteira.
Sandbox confunde isolamento e controle de acesso. Aperture e LangSmith movem o controle para a rede, e o agente nunca segura uma credencial real.
O acesso global ao S3 autorizado no AgentCore pode virar canal de C2 oculto. A contenção agora é responsabilidade do cliente, não da plataforma.
O gerador de model cards da NVIDIA monta cartões alinhados ao EU AI Act em menos de um minuto. O benchmark prova: documentação é a camada de governança.
Código de agente é produzido em escala para a qual repositórios humanos nunca foram feitos. Onde ele mora define proveniência e raio de impacto.
Daniel Epstein, da Microsoft, diz que o desenvolvimento com IA falha por processo, não por modelo. A solução: governança como critério de aceitação.
Labs de fronteira engolem wrappers horizontais. Verticais reguladas resistem porque o fosso é o andaime de governança, não a capacidade do modelo.
Modelos no dispositivo resumem, reordenam e reescrevem suas notificações push antes de um humano ler. A governança desceu para baixo da interface.
A WorkOS lançou um protocolo aberto para agentes se registrarem em qualquer serviço web. Encanamento certo. A política de confiança fica por sua conta.
O post da Cursor é a confissão de fornecedor mais precisa de 2026 sobre agentes na nuvem. Execução durável, ambientes isolados, estado desacoplado.
O RC 2026-07-28 do MCP abandona sessões stateful, fortalece OAuth e cria política de deprecação. Procurement ganha superfície avaliável.
A Antfly entregou TLA+ dirigido por agentes. Reuben Brooks entregou guard types de cálculo de sequentes. A tese de governança por spec virou código.
A Thoughtworks nomeou a arquitetura que faltava para qualidade de agentes de código: sensores. A CloudBees mostrou a conta de quem pula essa camada.
Nader Dabit lançou seis ganchos de ciclo de vida. Cameron Wolfe definiu Pass^K. Mesma semana, lados opostos do ciclo, uma tese de governança.
Anthropic, Fin, Docker, Nader Dabit e Altimeter nomearam a mesma camada em uma semana. A camada de controle agora é categoria de produto.
Produtos de IA substituíram o empty state por um prompt em branco. 70% dos novos usuários não voltam. A curva de retenção é o recibo da falha de governança.
A a16z nomeou a virada para Sistema de Inteligência. Linear e Google entregaram na mesma semana. A orquestração é o novo fosso e superfície de governança.
Cloudflare Artifacts entrega versionamento e rollback estilo Git para agentes de IA. Governança virou feature de plataforma, não whitepaper de compliance.
Unmesh Joshi (Thoughtworks) publicou a versão canônica do argumento que vimos defendendo. O segundo papel do código virou superfície de verificação.
Sen Lin publicou quatro Skills do Claude Code que forçam a IA a respeitar tokens. Kavcic adiciona contratos. Governança de design virou operação.
O RLCR do MIT CSAIL mostra que a superconfiança é artefato de treino, não propriedade do modelo. Corrigi-la muda o que a governança consegue decidir.
Harnesses de primeira parte superam terceiros em 2-3x. Labs absorvem comportamentos do harness no modelo. Sua vida útil é medida em gerações.
Três fornecedores. Uma arquitetura. O WorkOS Horizon completa a convergência que Ramp e Stripe começaram. Esta agora é a referência.
As cinco primitivas de Eugene Yan para compor com IA: contexto, config, verificação, delegação, fechamento de loop. Duas delas são as que quase ninguém faz.
Mesmo modelo, harness diferente, 4,5 pontos de variação. O Terminal-Bench 2.0 confirma que harness é variável de compra, não detalhe de implementação.
Anthropic, Figma e Vercel transformaram governança em superfície de produto na mesma semana. A planilha de compras agora tem itens comparáveis.
Três análises independentes convergiram para a mesma tese esta semana. Performance de modelo virou requisito básico. As barreiras estão em outro lugar.
Vercel, Perplexity e Addy Osmani publicaram três designs incompatíveis de Skills em seis semanas. A divergência mostra onde a governança precisa segurar.
Semana passada, o harness virou SKU. Esta semana, virou decisão de arquitetura. Três escolhas que times de compras assinam sem perceber.
Krishnan mediu arquiteturas multi-agente: código favorece solo, raciocínio favorece mercados, hub-spoke custa 4x mais. Procurement ganhou um número.
OpenAI no Bedrock, Mistral Vibe, AWS Neuron Agentic. Em sete dias, o runtime de agente virou compra de fornecedor, não construção interna.
Três autores, três domínios, uma mudança em uma semana: substratos estáticos não sobrevivem a agentes. Tokens, ADRs e julgamento sobem junto.
Ferramentas de IA aprenderam primitivas de código, não o seu design system. A correção não é disciplina do designer — é geração restrita.
OpenAI, Google e Adobe lançaram workspace-como-ambiente-de-agentes em sete dias. A camada de plataforma para governança está sendo definida agora.
Capacidade deixou de ser o gargalo. Obediência à especificação virou. E ela mora nos 60% de conhecimento de produto que vivem fora do código.
ManyIH-Bench testou modelos de fronteira em 12 níveis de privilégio. O teto é 40%. Sua governança baseada em hierarquia de prompts opera sobre essa base.
LukeW diz que designers deveriam codar de novo. A história real é governança: quando a IA colapsa o handoff, a fronteira se move e a responsabilidade muda.
Quatro sinais de abril de 2026 convergem: separação de papéis — planejador, executor, validador — substitui prompt engineering como unidade de governança.
Se memória é o fosso competitivo dos agentes e ela vive dentro do harness, então um harness alugado é um fosso alugado.
Anthropic lançou o harness como produto gerenciado. A decisão build-vs-rent deixou de ser técnica e virou, de vez, uma decisão de governança.
Anthropic desacopla cérebro/mãos/sessão. Claw-Eval avalia segurança junto com conclusão. Infraestrutura alcança capacidade.
Spec-Driven Development em escala exige transformação organizacional. Ferramentas resolvem sintaxe. Governança resolve o restante.
Pesquisadores da Meta forçaram agentes a construir certificados lógicos antes de julgar código. Funciona. Mas o modo de falha é pior que o original.
Matt Rickard, Google, GitHub, Anthropic e Kent Beck convergem em especificações como mecanismo primário de governança para agentes de IA.
Spacelift Intent, Google Skills, harness do Claude Code — o padrão é claro. Governança eficaz é invisível, embutida nas ferramentas.
Alucinações são inerentes a sistemas probabilísticos. Eliminá-las é impossível. Detectar, validar e controlar é governança de sistema.
Agentes de IA dão a usuários não-técnicos o poder de modificar e redistribuir software. Isso transforma código aberto em decisão de governança.
IA colapsa pensar, projetar e codificar em um passo. Um framework de cinco níveis força a separação. A contribuição real é o template de prompt.
PostHog criou 44 ferramentas antes de escolher MCP. Ossature adicionou verificação. Anthropic lançou classificador de segurança. Todos restringem o ambiente.
Três equipes em domínios diferentes construíram governança de agentes IA com os mesmos padrões. A convergência não é coincidência.
Stripe e Paradigm lançaram o Machine Payments Protocol com 100+ integrações e suporte Visa. O protocolo resolve infraestrutura. Não resolve governança.
Vint Cerf diz que confiança é infraestrutura. Lean 4 diz que tipos são prova. Uma especialista diz que specs viram código. Os três têm razão.
Três empresas lançaram contenção de agentes em uma semana. O padrão é idêntico: políticas YAML, proxies de saída, isolamento de credenciais.
Três frameworks independentes convergem na mesma conclusão: specs de agentes são controles auditáveis, não documentação técnica.
O padrão Agent Skills resolve o que agentes monolíticos nunca conseguiram: capacidades de IA modulares, auditáveis e versionadas.
Três praticantes redescobriram a mesma verdade: agentes de IA precisam de disciplina de engenharia, não de novos frameworks.
Agentes confiáveis nascem de restrições ambientais, não de prompts melhores. Três pesquisas convergem para a mesma conclusão.
Três empresas operando agentes de IA em escala convergiram no mesmo princípio: autonomia máxima dentro de restrições estruturais.
A maioria dos agentes de IA esquece tudo entre sessões. Descubra como aprendizado em tempo real transforma agentes.
Como usar IA que age e liberar tempo para o que importa. Casos de uso e ferramentas para PMs sem código.
Insights do copiloto Gen AI on-call da Uber. RAG vs fine-tuning, pipeline Spark, e o segredo da qualidade.
Um sistema de arquivos simples supera soluções sofisticadas de memória. Descubra o que os benchmarks revelam sobre arquiteturas de memória para agentes.
O guia definitivo para especificações que funcionam. 5 princípios testados por engenheiros do Google e GitHub.
A diferença entre IA que responde e IA que age. Como sistemas agênticos transformam expectativas e ganham 4x em produtividade.
A Workday teria pago US$ 1,1 bi por uma camada de interface de IA. A lição de governança: quem controla a interface controla a auditoria.
A Grab construiu agentes de investigação só-leitura e agentes de escrita como sistemas fisicamente separados. Governança por arquitetura.
Engenheiros do Google explicaram desenvolvimento orientado por spec no Cloud Next 2026. A metodologia não é nova. O compromisso público é.
Três praticantes independentes nomearam a mesma ideia com palavras diferentes esta semana. Velocidade de IA quebra sem verificação à altura.
Bedrock Managed Agents, conectores criativos do Claude e APIs amigas de IA. Três sinais, uma direção. Governança virou plataforma, não camada.
A OpenAI abriu uma spec que chama issue trackers de camada de controle para frotas de agentes de código. A disputa de vocabulário começou.
A Docker colocou microVMs sob cada agente. O gesto vale mais que a engenharia: limites de segurança saem do prompt e viram infraestrutura.
OpenAI atualizou o Agents SDK com separação harness-compute e sandboxes nativos. A arquitetura amadureceu. A governança continua ausente.
Sexto capítulo da série. A McKinsey publicou 12 temas para a transformação por IA. Dez deles não podem ser auditados sem uma camada de medição.
Thoughtworks propõe codificar padrões em instruções versionadas. A ideia é válida. O enquadramento é tímido.
Agentes de IA escolhem fornecedores sem RFP, sem comparação, sem funil. O vendedor que não governa como é descoberto perde o controle da receita.
A OpenAI embutiu controles de governança na Responses API. Isso valida a tese. Mas controles de plataforma são necessários e insuficientes.
McKinsey propõe dois caminhos para arquitetura empresarial na era agêntica. Os dois ignoram segurança. Os estudos de caso são inverificáveis.
Cursor atualiza modelos via RL em produção. OpenAI publica hierarquias de comando. Conteúdo sintético domina a web. Três sinais de um mesmo problema.
O quarto artigo da McKinsey sobre IA prescreve fábricas de agentes. Os dados do próprio artigo mostram por que a prescrição é insuficiente.
Figma abre o canvas para agentes via MCP. Design systems viram camadas de governança para interfaces geradas por IA.
OpenAI publicou Model Spec e Safety Bug Bounty. Dois artefatos que revelam como a empresa codifica comportamento e segurança de modelos em produção.
McKinsey foi de medir IA errado a chamar de problema de design a usar a palavra governável. O padrão revela mais que qualquer artigo isolado.
McKinsey diz que o problema de escala da IA é de design. Estão parcialmente certos. Design é a camada de interface da governança.
Uber e Stripe embutiram governança na infraestrutura. A Microsoft contratou um chefe de qualidade. O padrão revela o que falta.
GitLab reduziu 58% dos controles SOC com um framework customizado. Enquanto isso, IA reescreve código GPL em 5 dias. O que isso revela sobre governança.
Executivos auto-reportam ganhos de 16-45% com IA. Estudos controlados mostram 19% de lentidão. A lacuna não é erro de medição. É governança ausente.
A OpenAI publicou quatro perfis de personalidade para agentes IA. Eles perderam o ponto. Personalidade é governança comportamental, não cosmética.
Hyperscalers doam SDKs para vender infraestrutura. A disputa real é governança: segurança, avaliação, controle de contexto.
Desenvolvimento dirigido por specs acelera ciclos de PM. Também transforma cada requisito ambíguo em risco de produção.
Quando consultorias implementam seus agentes de IA, elas também definem sua governança. Empresas precisam decidir quem define as regras.
LLMs não escrevem apenas código tático. Eles transformam organizações inteiras em tornados táticos. A solução não é mais code review.
Apple e CMU mapearam 55 funcionalidades de UX para agentes de IA. A taxonomia revela que controle não é feature — é arquitetura.
Cursor, Docker, Zenity e Entire lançaram quatro camadas de contenção em uma semana. A transição de fadiga de aprovação para limites de confiança.
Plataformas de engenharia são o plano de controle natural para agentes de IA. Mas autonomia sem governança é só automação com mais risco.
A Anthropic publicou um guia para evitar 'AI slop' visual. O que não diz é mais revelador: modelos de IA precisam de governança estruturada para output.
Cada preocupação com geração de código por IA aponta para uma falha de governança, não uma deficiência tecnológica.
Equipes que codificam regras de marca no CLAUDE.md estão fazendo governança como código sem saber.
Análise dos movimentos da Anthropic na semana do Super Bowl: IA sem anúncios, F1, plugin jurídico e Sonnet 5.
O prêmio salarial de +56% não está em virar empreendedor. Está na camada de governança que 77% das empresas estão construindo agora.
IA comprime riscos de viabilidade, factibilidade e usabilidade. Desejabilidade se torna o diferencial. O que muda para equipes de produto.
Como grandes empresas integram IA em seus processos de design com templates, arquivos de instrução, plugins e chatbots internos.
Por que agentes de IA falham em produção e como orquestração resolve. Temporal, Conductor e LangGraph comparados.
Por que design conservador supera automação inteligente. Lições da engenharia nuclear para sistemas de IA resilientes.
Análise do framework de 23.000 palavras da Anthropic e como aplicar seus princípios na governança corporativa de IA.
Google UCP permite que agentes de IA finalizem compras em conversas. Veja como varejistas integram e o impacto no e-commerce.
Com salários de até R$ 21 mil, os profissionais de IA agêntica estão entre os mais demandados do Brasil. Mas o que isso significa para sua empresa?
Após um ano de projetos de IA agêntica, padrões claros emergem. Seis lições fundamentais para capturar valor real com agentes autônomos.
Construindo e implantando IA com governança integrada desde o primeiro dia.
Inicie Sua Implementação