Quando a margem do software cai para 17%: quatro rotas estratégicas para o P&L IA-nativo

Por duas décadas, o pitch deck de uma empresa SaaS carregou uma constante. Margem bruta perto de 80%. Margem líquida nos altos dois dígitos quando o negócio escalava. Toda a lógica financeira de software por assinatura repousava sobre a hipótese de que, depois que a plataforma estava pronta, servir o próximo cliente custava quase nada.

A IA mudou a estrutura de custos por baixo dessa hipótese. Inferência não é grátis. É uma despesa por tarefa que escala com o uso. Quando uma empresa SaaS embute funcionalidades de IA e paga a conta do modelo no lugar do cliente, o piso de margem bruta despenca. Não por alguns pontos. Por uma ordem de magnitude na direção errada.

Domen Jemec publicou em maio de 2026, no GPTomics, uma ilustração estruturada disso. Ele montou dois modelos. Uma SaaS tradicional, chamada GainZ. Uma IA-nativa, chamada AIBoost. Mesma receita por usuário, mesma curva de crescimento, mesmo time operacional. A única variável que muda é se o custo de inferência fica dentro do custo de receita.

O resultado, tratado como cenário e não como pesquisa: GainZ aterrissa em 80% de margem bruta e 19% de margem líquida em um milhão de usuários. AIBoost aterrissa em 17% de margem bruta e 11% de margem líquida na mesma escala. Mesma categoria de produto. Mesma base de clientes. Física financeira radicalmente diferente.

Os números ilustrativos não são o ponto. O ponto é a pergunta que todo operador de feature de IA precisa responder. Se o seu negócio foi precificado sobre comparáveis SaaS e a sua estrutura real de custos se parece com a AIBoost, qual é a sua rota estratégica de escape?

Jemec esboça quatro. Cada uma carrega uma postura de governança diferente, porque em 17% de margem bruta cada erro evitável de agente deixa de ser problema de processo. Vira custo existencial.

O cenário: o que os números efetivamente mostram

Os cenários de Jemec usam inputs deliberadamente simples. US$ 120 de receita anual por usuário. Custos fixos que crescem 10% a cada vez que a base de usuários dobra. Um custo unitário de inferência constante que escala linearmente com o uso. Trate os números absolutos como ilustração. O que importa é o formato da diferença entre os dois modelos.

Em SaaS tradicional, a margem bruta é dominada por hosting e suporte. Os dois se comportam como custos fixos que se diluem com a escala. Os 80% saem do modelo quase automaticamente.

Em software IA-nativo, a margem bruta é dominada por inferência, que se comporta como custo variável e não se dilui. Mais usuários, mais tokens, mais conta. Os 17% saem do modelo com a mesma naturalidade, sem que nenhum erro operacional seja necessário para chegar lá.

Duas consequências para qualquer operador. Primeira, o mesmo crescimento que compunha lucro em SaaS agora compõe conta de inferência no mesmo ritmo. Segunda, o intervalo entre a sua receita e o seu gasto com modelo é onde toda falha de governança aparece. Uma taxa de 5% de retry que ninguém detecta em um P&L SaaS é invisível. Em um P&L IA-nativo a 17% de margem bruta, esse mesmo 5% pode mover a linha entre usuário lucrativo e usuário deficitário.

Cobrimos o lado da oferta dessa discussão em A economia da IA fraturou em três eixos na mesma semana e o lado do produto de consumo em Margem negativa: a inversão SaaS que a Cursor expôs. A contribuição de Jemec é o enquadramento de opções estratégicas. Uma vez que você aceita que o piso de margem se moveu, a próxima pergunta é o que você faz a respeito.

Rota 1: cópias baratas

Ferramentas de IA cortaram o custo de construir software em cerca de 90%, no enquadramento de Jemec. Isso é vento de cauda para incumbentes, mas vento muito maior para entrantes. Se um clone pode ser entregue em um ano por um time pequeno, o fosso construído só sobre produto fica raso.

A postura estratégica aqui é honesta. Você compete em preço, em distribuição ou em velocidade de iteração. Você não finge ter um fosso que o custo de construção já não sustenta. Mantém o P&L apertado, mantém o gasto de tokens disciplinado e aceita que a sua categoria vai fragmentar.

Pergunta de governança: como manter o custo de inferência alinhado com a receita quando a categoria caminha para a guerra de preços? Cada token desperdiçado é um pedaço de margem que você não pode perder.

Rota 2: nicho e ultra-baixo custo

O outro lado do custo de construção menor é que segmentos antes inviáveis se tornam atendíveis. Mercados que eram pequenos demais ou sensíveis demais a preço para a economia SaaS antiga agora comportam um produto focado.

Uma ferramenta de nicho para um papel específico em uma indústria específica, precificada a R$ 100 por mês em vez de R$ 1.000, não fechava conta em 2020. Com IA reduzindo custo de construção e custo de operação juntos, fecha. A troca é volume por encaixe. Você atende menos clientes, mas os que atende não encontram opção melhor.

Pergunta de governança: como manter o custo operacional baixo o suficiente para que o preço ultra-baixo ainda deixe espaço para margem? A R$ 100 por mês, um dólar a mais de inferência mensal é 5% da receita. A disciplina não pode ser opcional.

Rota 3: software de luxo

A terceira rota é a que a maior parte dos operadores não considerou a sério. Software precificado como bem de luxo. Não premium, luxo. Em que o preço em si faz parte da proposta de valor.

Jemec cita Raya, Dorsia e Bloomberg Terminal a US$ 32 mil por ano. Cada um se sustenta em algo que o comprador não consegue mais barato. Curadoria, acesso, efeito de rede ou, no caso da Bloomberg, um workflow tão entranhado em uma profissão que trocar é impensável.

O risco é o I Am Rich App. Um aplicativo de iPhone a US$ 999 cuja única função era exibir uma joia vermelha para sinalizar riqueza. Falhou porque não havia diferenciação funcional sob o preço. Software de luxo sem substância operacional é performance, e o mercado percebe.

A versão honesta é mais difícil. Software de luxo de verdade ganha o preço por algo que as cópias baratas não conseguem replicar. Dados proprietários. Uma rede curada. Um lock-in de workflow que nenhum modelo sintetiza sozinho.

Pergunta de governança: como manter o padrão operacional que o preço implica? Em precificação de luxo, uma falha visível de agente não é evento de reembolso. É evento de marca.

Rota 4: além de software

A quarta rota é a mais defensável e a mais pesada operacionalmente. Você deixa de ser uma empresa de software puro. Integra verticalmente em átomos, em dados ou em um workflow que software puro não consegue ocupar.

Átomos significa operação física. Uma empresa de robótica cirúrgica. Uma plataforma de drone-as-a-service. Uma rede de fulfillment com software como tecido conjuntivo. A camada de hardware ou operação cria uma estrutura de custo que concorrentes só-IA não replicam escrevendo mais código.

Dados significa informação proprietária que concorrentes não conseguem raspar. Um dataset clínico construído ao longo de uma década. Um motor de preços alimentado por transações que só a sua rede vê. O dado é o fosso, e o modelo é a camada de acesso a ele.

Pergunta de governança: como manter confiável a camada integrada quando ela toca o mundo físico ou um dataset regulado? Toda rota desta lista depende de alguma forma de confiança, mas esta não tolera uma única falha não recuperável. Uma alucinação em sistema de roteamento de drone não é problema de margem. É recall.

O padrão entre as quatro

Cada rota existe porque o cenário de 17% de margem bruta é real o bastante para forçar uma escolha. Não fazer nada é a quinta opção, e é aquela em que a conta estoura primeiro.

Três observações cruzando as quatro.

A primeira é que disciplina de governança passa a ser financeira, não procedimental. A 80% de margem bruta, você investe em maturidade de processo mesmo sem conseguir medir o retorno. A 17% de margem bruta, cada dólar evitável de gasto com modelo cai direto na linha final. Os times que sobrevivem serão os que tratam medição de gasto de tokens, erros de agente e taxa de retry como problema de unit economics, não como cortesia operacional.

A segunda é que as rotas não são mutuamente exclusivas na mesma empresa, mas são mutuamente exclusivas na mesma linha de produto. Uma oferta de luxo e um clone barato não compartilham roadmap. A decisão pertence à estratégia, não ao produto.

A terceira é que o comparável de uma empresa IA-nativa não é mais a SaaS tradicional do mesmo vertical. É a rota que descreve a estratégia. Um workflow de IA de luxo deve ser comparado a serviços de luxo. Uma ferramenta de IA de nicho deve ser comparada a outros especialistas de nicho. Comparar P&L IA-nativo com margem bruta de SaaS legada faz toda rota legítima parecer fracasso.

Faça isso agora

Se você opera um negócio IA-nativo ou IA-adjacente, dê três passos nas próximas duas semanas.

Construa o modelo no estilo AIBoost para o seu próprio produto, com a sua precificação e o seu gasto de tokens. Não pegue emprestado os números de Jemec. Use os seus. Descubra onde sua margem bruta realmente aterrissa.

Escolha a rota que combina com a sua estratégia. Se você roda uma feature de IA dentro de uma SaaS tradicional e não está verticalmente integrado, você provavelmente já está em uma trajetória de cópia barata ou de nicho, tenha admitido ou não. Nomeie a trajetória e alinhe preço, investimento em governança e roadmap a ela.

Trate a governança da sua inferência como item de unit economics. Cada retry evitável, cada loop, cada chamada mal roteada não é mais incômodo de processo. Na sua margem bruta real, é a diferença entre uma rota que se paga e uma que não se paga.

O cenário de 17% é ilustrativo. A decisão que ele força é real.

Fontes

GPTomics / Domen Jemec. “How AI Changes Software P&L.” Maio de 2026.

A Victorino ajuda empresas IA-nativas e IA-adjacentes a alinhar investimento em governança com a economia real do P&L: contato@victorino.com.br | www.victorino.com.br