Quatro Relatórios, Uma Semana, a Mesma Lacuna de Medição

TV
Thiago Victorino
7 min de leitura
Quatro Relatórios, Uma Semana, a Mesma Lacuna de Medição
Ouvir este artigo

Esta semana abri quatro leituras em ordem mais ou menos aleatória. Ant Murphy sobre o abismo da adoção de IA. Ben Murray sobre a margem bruta de SaaS ruindo sob peso de inferência. Armando Roggio comparando os números da Adobe com o estudo Kaiser-Schulze sobre tráfego de e-commerce vindo do ChatGPT. Emily Kramer dissecando 100 times de marketing B2B em alta expansão.

Quatro funções. Quatro amostras. Quatro metodologias diferentes. Quatro ângulos do mesmo buraco.

Vale dizer de saída: eu não descobri um padrão. Escolhi quatro leituras que, juntas, compõem um padrão. O recorte é meu, e se eu quisesse o contrário, provavelmente teria encontrado. Isso não invalida o que vem a seguir. Mas é honesto marcar o que é curadoria editorial e o que seria descoberta natural. Aqui é curadoria.

Com isso dito, o padrão é este: as organizações afirmam que usam IA, e não conseguem provar, nem para si mesmas, o que a IA está entregando. Cada função inventou sua própria régua. Quando você coloca as quatro réguas lado a lado, elas não se encontram em lugar nenhum.

O que cada relatório diz, sem apertar o parafuso

Murphy, engenharia. Ele ressuscita o enquadramento do “Crossing the Chasm” de Geoffrey Moore e aplica à adoção corporativa de IA. Cita o State of AI 2025 da McKinsey: 88% das organizações usam IA em pelo menos uma função, 1% se descreve como “madura” na implementação. Murphy usa esses dois números como um choque retórico. A comparação é, por construção, incompatível. Os 88% medem qualquer uso em qualquer função. O 1% mede maturidade plena autodeclarada na empresa inteira. Denominadores diferentes, perguntas diferentes. A distância entre eles não é uma lacuna de capacidade. É a distância definicional entre “a gente usa” e “a gente sabe quanto vale.”

Murray, finanças. Ele argumenta que produtos SaaS carregados de IA estão apertando margens brutas do padrão da indústria, de 70 a 80%, para algo na casa de 52%. O 52% vem da ICONIQ, que pesquisou cerca de 300 executivos de produto de IA em sua própria carteira financiada por VC. É uma projeção para 2026, não margem realizada. Os respondentes se autosselecionaram. Murray é honesto sobre a fonte; muitos leitores vão tratar o número como margem auditada. Não é.

Roggio, e-commerce. Ele põe frente a frente dois relatórios que parecem, à primeira vista, contradizer-se. Segundo a análise da própria Adobe (que vende ferramental para comércio com IA, vale registrar), o tráfego vindo de IA converte 42% melhor que o tráfego tradicional, navega mais páginas e rejeita menos. Segundo Kaiser e Schulze, em estudo acadêmico com 973 sites, US$ 20 bilhões em receita e 164 milhões de transações no período de agosto de 2024 a julho de 2025, o ChatGPT respondeu por menos de 0,2% do tráfego e converteu 13% abaixo da busca orgânica.

Isso não é contradição. A Adobe mede valor por visita dentro de um coorte pequeno de visitantes trazidos por IA. Kaiser-Schulze mede participação de canal no total de transações. Um canal pequeno e de alta qualidade continua sendo um canal pequeno. As duas afirmações são verdadeiras. Perguntas diferentes, dados complementares. O que incomoda é que um CMO hoje precisa planejar sem saber qual das duas réguas sustenta o próprio número do ano que vem. Vale notar também que o estudo Kaiser-Schulze termina em julho de 2025, antes da popularização de agentes de navegação como Operator, Atlas e Comet. O referrer do ChatGPT mede o mundo pré-agêntico. O subcount futuro pode ser material.

Kramer, marketing. O MKT1 analisou vagas em aberto em 100 empresas B2B com receita acima de US$ 500 milhões. Das 507 vagas mapeadas, 84% mencionam “IA” na descrição, 18% mencionam “agente/agêntico”, 6% mencionam “LLM”. As empresas estão contratando capacidade de IA mais rápido do que contratam liderança de IA. Só 27 dessas 100 companhias têm CMO hoje. Importante: a amostra é enviesada para a rede de startups B2B do MKT1 e não estende para marketing em geral. “Menciona IA na descrição da vaga” também é um indicador quase gratuito. Diz pouco sobre o que a pessoa contratada vai fazer, e menos ainda sobre como alguém vai medir se ela fez.

O motivo de quatro funções divergirem ser diferente agora

O contra-argumento honesto é o pluralismo saudável. Funções diferentes sempre mediram coisas diferentes. CFOs medem margem bruta. PMs medem ativação. Marketing mede pipeline. E-commerce mede conversão. Ninguém esperava uma régua unificada para “uso de nuvem” ou “uso de mobile”. Por que agora?

A resposta é que o ativo subjacente é o mesmo. Uma única classe de modelos sustenta a superfície de marketing, a superfície de comércio, a superfície de produto e a linha de custo de inferência na DRE. O mesmo LLM aparece escrevendo o copy, respondendo o chat do shopper, automatizando o fluxo de suporte e consumindo tokens que descem na linha de COGS. Medir cada superfície em silo não produz quatro perspectivas complementares sobre coisas diferentes. Produz quatro perspectivas incompatíveis sobre a mesma coisa. Não é divergência entre objetos. É divergência sobre um objeto único.

Sem um placar compartilhado, o CEO olha para uma tabela de custo de inferência que diz uma coisa, para um relatório de vagas que diz outra, para um deck do marketing que diz uma terceira, e para uma projeção de margem que diz uma quarta. Todas verdadeiras. Nenhuma reconciliável.

O que o Salesforce está fazendo que os outros ainda não fizeram

No Q4 FY2026, o Salesforce reportou para o Agentforce US$ 800 milhões em ARR, 169% de crescimento ano a ano (sobre uma base pequena, vale lembrar), 29 mil deals fechados. Consumiu cerca de 20 trilhões de tokens e declarou ter entregue 2,4 bilhões de “unidades de trabalho agêntico”. Essa última métrica é o que me interessa. O “agentic work unit” não é GAAP. Não é padrão da indústria. O Salesforce o inventou porque a contabilidade SaaS tradicional não descreve o que a operação deles está fazendo. Inventaram a unidade antes de alguém inventar para eles. Quem vence a transição de IA é quem consegue nomear a própria unidade antes de ser comparado no placar que outro desenhou.

Como exploramos antes, e o que muda aqui

Em O espectro da adoção de IA enquadramos a diferença 6x entre quem sabe operar IA e quem não sabe como uma questão de produtividade. Em A governança bloqueia a IA empresarial, argumentamos que o limite é governança, não capacidade. E 164 milhões de compras revelaram o problema de conversão do tráfego de IA cobriu Kaiser-Schulze por conta própria, antes do contraponto da Adobe entrar em cena.

O que muda é que agora temos quatro leituras simultâneas descrevendo o mesmo buraco estrutural, cada uma na linguagem da própria função. Não é que a governança esteja faltando. É que a forma de contar está faltando, e a ausência da forma de contar é como a ausência de governança se manifesta.

Os contra-argumentos que eu ainda carrego

“Isso é pluralismo saudável, não lacuna de governança.” É o contra-argumento mais forte. Minha única resposta é a que dei acima: o objeto medido é o mesmo; réguas incompatíveis sobre o mesmo objeto produzem risco, não diversidade.

“Os preços de inferência caem cerca de 10x por ano; a lacuna de margem bruta pode fechar sozinha.” Talvez. Mas o uso agêntico consome 10 a 100 vezes mais tokens por fluxo do que o chat. Pode ser que a queda de preço compense. Pode ser que o volume comprima ainda mais. É honesto dizer que não sei qual direção vence.

“88/1 é truque de denominador.” É. Por isso atribui ao Murphy e à McKinsey, com a ressalva. A estatística mais útil do mesmo relatório é a fração de empresas que atribui mais de 5% do EBIT à IA: algo em torno de 6 a 7%. Esse é um denominador com conteúdo.

Divulgação

A Victorino constrói infraestrutura para colocar humanos e agentes de IA num placar compartilhado. Vendemos medição. Isso significa que temos interesse comercial em argumentar que a medição está quebrada. Foi por isso que este padrão me chamou atenção, e foi por isso que tentei falsificá-lo em cada seção. O leitor decide se o padrão resiste ao meu próprio viés. Eu concluí que sim. Meu argumento não é que sua empresa precise de um produto da Victorino. É que, se você dirige uma organização que afirma usar IA, a próxima pergunta que alguém (conselho, investidor, auditor) vai fazer é: como você conta?

Se a resposta varia de função para função, você já tem o diagnóstico.


Fontes

A Victorino constrói infraestrutura de placar compartilhado para humanos e agentes de IA. Vendemos medição, e divulgação importa. Fale com a gente: contato@victorino.com.br | www.victorino.com.br

Todos os artigos do The Thinking Wire são escritos com o auxílio do modelo LLM Opus da Anthropic. Cada publicação passa por pesquisa multi-agente para verificar fatos e identificar contradições, seguida de revisão e aprovação humana antes da publicação. Se você encontrar alguma informação imprecisa ou deseja entrar em contato com o editorial, escreva para editorial@victorino.com.br . Sobre o The Thinking Wire →

Se isso faz sentido, vamos conversar

Ajudamos empresas a implementar IA sem perder o controle.

Agendar uma Conversa