Capacidade vale US$ 26 bi. Quem mede o ROI do agente?

Em 27 de maio de 2026, a Cognition anunciou uma Série D de mais de US$ 1 bilhão a uma avaliação de US$ 26 bilhões. Lux Capital, General Catalyst e 8VC lideraram a rodada. A empresa relata um run-rate de US$ 492 milhões e uso corporativo mais de 10 vezes maior desde o início de 2026. O produto é o Devin, um agente autônomo de engenharia de software, e a lista de clientes parece um time de primeira linha: Citi, Mercedes-Benz, Goldman Sachs, Santander, Itaú, Dell, Elevance, Infosys, Cognizant, além do Exército e da Marinha dos Estados Unidos.

A capacidade agora está capitalizada. Um mercado que precificava dúvida dezoito meses atrás acaba de precificar convicção em US$ 26 bilhões. A pergunta interessante não é se o Devin sabe escrever código. O mercado já respondeu isso. A pergunta é se os compradores conseguem provar o que compraram.

O número que falta no anúncio

Leia o anúncio da Cognition e você encontra cifras impressionantes. A Mercedes-Benz teria comprimido um projeto de modernização de sistema legado de oito meses para oito dias. O Itaú relata que o Devin corrige automaticamente 70% das vulnerabilidades de segurança. Internamente, a Cognition afirma que 89% do código entregue pelos próprios engenheiros é entregue pelo Devin.

Cada um desses números é uma alegação do fornecedor. Isso não é acusação; é categoria. A cifra da Mercedes e a do Itaú são autorrelatadas, não verificadas por terceiros. O número interno de 89% é a Cognition medindo a Cognition, o que diz que a ferramenta funciona para quem a construiu, no ambiente para o qual foi construída. Nada disso diz a um comprador no Citi ou no Santander a única coisa que importa na hora da compra: como o Devin se sai contra os meus próprios engenheiros, no meu próprio trabalho, em uma única métrica compartilhada?

Esse número está faltando. Não porque a Cognition o escondeu. Porque quase ninguém está preparado para produzi-lo.

Capacidade não é ROI

Há uma substituição silenciosa acontecendo em todo negócio corporativo de IA neste momento. O fornecedor demonstra capacidade. O comprador infere ROI. Não são a mesma coisa, e a distância entre as duas é onde os orçamentos morrem.

Capacidade é “o Devin fechou o chamado”. ROI é “o Devin fechou o chamado mais rápido, mais limpo e com menos retrabalho do que o caminho que já estávamos seguindo, e aqui estão os dados de vazão, taxa de defeitos e retrabalho que provam isso ao longo de um trimestre”. A primeira é uma demo. A segunda é evidência. Uma avaliação de US$ 26 bilhões se apoia na premissa de que capacidade se converte em ROI dentro dos ambientes dos clientes em escala. Hoje, essa premissa é um ato de confiança.

Confiança é boa como ponto de partida. É perigosa como posição permanente. A história dos oito meses para oito dias é o tipo de cifra que ganha uma reunião de conselho e perde uma renovação, porque a renovação acontece depois que o comprador conviveu com o retrabalho, com o custo de carregar contexto, com os casos em que o agente entregou algo errado com toda a confiança. Se a única medição é a do fornecedor, o comprador voa pelos instrumentos do fornecedor.

O teste do placar

Já argumentamos que a unidade certa de medição na era dos agentes é a equipe, não o modelo, e que capacidade está virando commodity enquanto a orquestração vira o moat. A rodada da Cognition é a ilustração mais nítida até agora de por que esse enquadramento importa no nível do orçamento.

Eis o teste que qualquer empresa assinando um contrato do Devin deveria conseguir passar. Coloque seus engenheiros humanos e seu agente em um único placar. As mesmas linhas: vazão, taxa de defeitos, taxa de retrabalho, tempo de ciclo, defeitos que escaparam. O mesmo período. A mesma definição de “pronto”. Então olhe as colunas lado a lado.

Se você não consegue montar esse placar, você não está medindo o agente. Está medindo a sua fé no anúncio. E no momento em que você não consegue mostrar a saída do agente ao lado da saída da sua equipe nas mesmas linhas, você perdeu a capacidade de responder à única pergunta que o seu CFO fará em doze meses: a ferramenta avaliada em US$ 26 bilhões de fato bateu a base que já tínhamos?

Há um ponto de segunda ordem escondido aqui. A maioria das empresas também não passa nesse teste para as próprias equipes humanas. Elas não medem vazão, taxa de defeitos e retrabalho em uma superfície consistente. Então, quando o agente chega, não há base de comparação. O agente não cria o déficit de medição. Ele expõe um déficit que já existia, e o torna caro.

Por que isso precifica os próximos 24 meses

A capacidade foi capitalizada. Essa etapa acabou. A próxima etapa é a verificação, e ela vai separar os compradores que mediram dos compradores que confiaram.

Os compradores que montaram o placar compartilhado antes de implantar o Devin saberão, ao fim do trimestre, exatamente o que compraram: um multiplicador com um número atrelado, ou um custo com uma história atrelada. Eles vão renovar com base em evidência ou cortar com base em evidência. De um jeito ou de outro, controlam a decisão.

Os compradores que implantaram na força do anúncio vão passar os próximos 24 meses discutindo internamente se funcionou, porque ninguém instrumentou o antes e o depois. Essa discussão não se ganha com dados. Ganha-se com quem tem mais capital político, que é a pior forma de tomar uma decisão de alocação de capital.

Os portões de governança existem para impedir que empresas apostem no não verificado. A medição é o portão que mais importa aqui, porque é o que converte uma aposta de US$ 26 bilhões em um fato de US$ 26 bilhões, ou a pega antes que a renovação o faça.

Faça isso agora

Antes de assinar ou expandir qualquer contrato de agente autônomo, monte o teste do placar único. Escolha cinco métricas: vazão, taxa de defeitos, taxa de retrabalho, tempo de ciclo, defeitos que escaparam. Defina “pronto” uma vez, para humanos e agentes. Capture uma base da sua equipe humana referente ao trimestre anterior, mesmo que seja aproximada. Então rode o agente nas mesmas linhas por um trimestre e ponha as colunas lado a lado.

Se você não consegue capturar a base humana, essa é a sua primeira descoberta, e ela é mais urgente do que a decisão sobre o agente. Você está prestes a comprar trabalho autônomo que não tem como avaliar, dentro de uma equipe que não tem como avaliar. Conserte o placar primeiro. A capacidade é real e é cara. Faça-a provar o próprio valor na mesma superfície que a equipe que você já paga.

O mercado precificou a capacidade em US$ 26 bilhões. Precifique o ROI você mesmo.

Fontes

Cognition. “Cognition Series D announcement.” Maio de 2026.

A Victorino ajuda empresas a medir pessoas e agentes de IA no mesmo placar antes de apostar o orçamento: contato@victorino.com.br | www.victorino.com.br