- Início
- The Thinking Wire
- Os Laboratórios Viraram Consultorias. O Cargo Mais Quente é Forward Deployed Engineer.
Os Laboratórios Viraram Consultorias. O Cargo Mais Quente é Forward Deployed Engineer.
Em quatro semanas, os três laboratórios de fronteira admitiram a mesma coisa. O produto não é o modelo. O produto é o engenheiro que instala o modelo.
A Anthropic anunciou uma subsidiária de consultoria com forward-deployed engineers em 4 de maio de 2026, com Blackstone, Hellman and Friedman e Goldman Sachs como investidores. A OpenAI capitalizou sua Deployment Company em 11 de maio com US$ 4 bilhões da TPG e da Advent, em um valuation de US$ 14 bilhões, e em seguida comprou a Tomoro do Reino Unido, absorvendo 150 forward-deployed engineers entre Reino Unido, Ásia e Austrália. No final de maio, Gergely Orosz reportou no The Pragmatic Engineer que o Google Cloud havia comprimido seu funil de entrevistas para forward-deployed engineer de quatro a seis entrevistas ao longo de várias semanas para duas entrevistas em dois dias.
Dois dias. Para uma vaga de engenharia. Em um laboratório de fronteira.
Isso não é política de contratação. É admissão estrutural. Os laboratórios precisam de humanos dentro das contas dos clientes mais rápido do que conseguem modelar. A Slow Ventures cunhou o padrão de forma mais limpa: AI Accenture, não Accenture for AI. Os laboratórios não estão contratando consultores. Estão se tornando a consultoria, e estão precificando o cargo como se a casa estivesse pegando fogo.
O sinal vem do mercado de trabalho
A história de fusão e aquisição é barulhenta, mas a história do mercado de trabalho é mais alta, e mais difícil de contestar.
O recorte de Kyle Poyar sobre os dados da Sumble (Growth Unhinged, 20 de maio) é a primeira foto limpa do que a IA está fazendo com o headcount de go-to-market. As vagas totais de GTM caíram 15% ano contra ano no primeiro semestre de 2026. SDR e BDR caíram 21% no mercado todo. Suporte ao cliente caiu 37%, o maior declínio de qualquer função de GTM. Camadas inteiras do funil estão sendo despovoadas em tempo real.
Agora o contra-recorte. Cursor, Decagon e a própria OpenAI dobraram seu próprio headcount de SDR no mesmo período. Os fornecedores AI-native cujo pitch é “automação substitui vendas” estão contratando vendas mais rápido do que qualquer um. As vagas de GTM engineering, a função híbrida de produto mais pipeline, dobraram ano contra ano e passaram de 400 posições abertas no mercado público. Vendas e engenharia de soluções combinadas hoje representam cerca de 60% de todas as vagas de GTM.
O quadro não é “a IA elimina empregos de vendas”. O quadro é “a IA elimina o fundo do funil e puxa o resto do funil para dentro da engenharia”. O trabalho que sobrevive fica próximo do sistema de registro do cliente. O trabalho que morre fica próximo de um script.
Esse é o mesmo formato do anúncio de FDE. Os laboratórios e os fornecedores AI-native não estão prevendo um futuro em que o software se vende sozinho. Estão construindo uma organização em que engenheiros vendem, instalam e operam o software, e o resto do funil é comprimido para dentro do modelo.
Por que as aplicações precisam deste formato
A resposta estrutural para o porquê disso estar acontecendo mora em Tech Bifurcation and the 0.5 Layer, de Neevash Ramdial (maio de 2026). Ramdial argumenta que existe uma nova camada de infraestrutura emergindo entre o modelo de fundação e a aplicação, a camada onde execução de agente, recuperação, avaliação e roteamento de fato vivem. Ele aponta para empresas como Turbopuffer (US$ 100M de ARR rentáveis sobre menos de US$ 1M captados), Modal (US$ 355M de Série C em valuation de US$ 4,65 bilhões) e Mintlify (onde aproximadamente metade do tráfego de documentação hoje vem de agentes de IA lendo docs em nome de usuários humanos) como prova de que a 0.5 layer é real, grande e capitalizada.
O mesmo post cita uma demonstração do próprio Neevash em que o Google Antigravity 2.0 construiu um sistema operacional funcional em cerca de 12 horas, orquestrando 93 sub-agentes a um custo total de menos de US$ 1.000. Isso não é matéria de produto. É matéria de custo de entrega. O modelo agora é barato e capaz o suficiente para que o gargalo seja o trabalho humano de apontá-lo para um problema real do cliente, estruturar o grafo de agentes e operar o resultado.
Esse trabalho humano tem um nome. Forward deployed engineer.
Argumentamos em Os Laboratórios de Fundação Estão Absorvendo Seu Stack que os laboratórios estavam colapsando modelo, runtime, ferramentas de desenvolvimento e consultoria em um único balanço. A construção do braço de FDE é o modelo de staffing sob esse colapso. A tese da 0.5 layer explica por que o modelo de staffing tem que ter este formato. Você não consegue entregar uma demo de “OS do zero por US$ 1.000” através de um ciclo quote-to-cash de nove meses e quatro calls de descoberta. Precisa de um engenheiro que consiga sentar com o especialista de domínio do cliente na segunda e entregar o grafo de agentes na sexta.
O que “FDE” significa hoje
O cargo em si é mais velho do que a reestruturação dos laboratórios. A Palantir inventou a versão moderna nos anos 2010. O padrão era simples. Mandar um engenheiro de verdade para dentro da conta do cliente. Deixar esse engenheiro virar funcionário temporário da operação do cliente. Construir o fluxo de trabalho em torno dos dados reais e das restrições reais do cliente. Deixar o fluxo instalado quando o engenheiro sair.
O que mudou em maio de 2026 foi o volume e o preço pedido. Anthropic, OpenAI e Google agora estão escalando vagas de FDE, e os pacotes de remuneração estão tirando engenheiros de aplicação seniores de todos os outros cantos da indústria. O funil de duas entrevistas do Google é a denúncia. Quando um laboratório de fronteira comprime seu processo de contratação em uma ordem de grandeza, o laboratório não está relaxando a régua. O laboratório está admitindo que a oferta de humanos qualificados é a restrição, e que cada semana que o funil leva é uma semana em que o FDE de um concorrente chega primeiro no escritório do cliente.
Esse é o sistema operacional do modelo AI-Accenture. Não é metodologia. Não é deck. É um banco de engenheiros, alocados pelo laboratório, enviados para dentro de contas de cliente, pagos com receita de modelo. Os laboratórios não precisam de um produto novo para competir com a McKinsey. Precisam de um novo organograma. Já construíram.
O que isso muda para os compradores
Três consequências vão aterrissar nos times de compras e nos organogramas de engenharia neste trimestre.
Primeira, você vai ser vendido por um engenheiro. O AE vai apresentar a sala e sair. O trabalho de escopar, demonstrar e recomendar vai ser feito por alguém cujo pager rota de volta para o time de produto do laboratório. Essa pessoa vai ser brilhante, rápida e estruturalmente enviesada para o stack do laboratório. Planeje esse viés do mesmo jeito que planejaria para qualquer arquiteto de solução de fornecedor, só que mais ainda, porque este aqui escreve o código que vai para produção.
Segunda, sua própria área de GTM vai esvaziar no fundo e engrossar na engenharia. Os dados do Poyar não são previsão. São medição. Se seu time de sales development representa mais de 20% do headcount de GTM, seus pares já estão cortando na sua direção. Se sua função de GTM engineering ainda não existe, seus pares já estão montando. Os cargos que sobrevivem ficam próximos dos sistemas do cliente. Os cargos que somem ficam próximos de um script.
Terceira, seu modelo de entrega precisa de uma camada no formato FDE, ou você vai terceirizar essa camada para qualquer laboratório que chegar primeiro no cliente. Esse é o espelho do lado do comprador da consolidação dos laboratórios. Se você vende software que toca IA, o cliente vai esperar um forward-deployed engineer na sala, porque é isso que todo outro fornecedor da fila de compras dele agora oferece. Construa a função internamente ou alugue de um parceiro que não esteja vendendo também o modelo de base. As duas opções funcionam. “Nenhuma das duas” não funciona.
Faça isso agora
Coloque três coisas no livro neste trimestre.
Conte suas pessoas no formato FDE. O título do cargo não importa. Conte os engenheiros que conseguem sentar no escritório de um cliente na segunda e entregar código em produção na sexta. Se o número for menos de 10% da sua área de engenharia e você vender para o enterprise, você tem um déficit de entrega que seus parceiros fornecedores vão preencher para você em dois trimestres.
Audite sua função de GTM engineering. Se ela não existe como time nomeado com orçamento próprio, nomeie agora. A função vive entre produto, engenharia de vendas e operações de pipeline. As pessoas que ocupam essa função normalmente são engenheiros full-stack com linha de receita atrelada. Os dados da Sumble mostram a função dobrando ano contra ano. O mercado está reprecificando esse trabalho em tempo real.
Estresse os stacks de fornecedor único. Se seu fornecedor de IA está mandando um forward-deployed engineer, peça ao fornecedor um plano de saída por escrito. Que conhecimento transfere quando o FDE sair? O que roda na sua infraestrutura versus na do laboratório? Como fica o fluxo quando você trocar o modelo daqui a 18 meses? Os laboratórios estão precificando o cargo de FDE como se a casa estivesse pegando fogo porque sabem que o fluxo instalado hoje é a decisão de compra travada amanhã. Planeje a saída enquanto ainda tem a alavanca de negociação de cliente novo.
O movimento AI-Accenture não é previsão. É organograma que já existe, capitalizado, com pessoal alocado e precificando agressivamente. Os compradores que perceberem em maio de 2026 preservam a opcionalidade. Os compradores que perceberem em maio de 2027 vão assinar o SOW que o FDE escreveu no trimestre passado.
Fontes
- The Pragmatic Engineer. “The Pulse: Forward-Deployed Engineering Heats Up Again.” Maio de 2026.
- Growth Unhinged. “Who’s Actually Hiring in GTM Right Now.” Maio de 2026.
- Neevash Ramdial. “Tech Bifurcation and the 0.5 Layer.” Maio de 2026.
A Victorino apoia empresas na construção da camada de entrega no formato FDE que contratos de fornecedores de IA agora assumem existir: contato@victorino.com.br | www.victorino.com.br
Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →
Se isso faz sentido, vamos conversar
Ajudamos empresas a implementar IA sem perder o controle.
Agendar uma Conversa