27% das Fontes do ChatGPT Aparecem no Google. Isso É Problema de Governança.

Construímos uma série sobre como a IA decide o que citar. Em Como a IA Decide o Que Citar, examinamos o viés de atenção posicional. Em Não Existe Fórmula Universal de Citação por IA, mostramos que a mecânica de citação varia por vertical. As duas análises pressupunham algo que novos dados colocam em questão: que as citações do ChatGPT vêm do mesmo conjunto de conteúdo que os mecanismos de busca apresentam.

Na maioria dos casos, não vêm.

O Estudo

Katelyn Urich, da Grow and Convert, testou 100 prompts de intenção de compra no ChatGPT. Não a API. A interface real que as pessoas usam quando perguntam “qual CRM devo contratar” ou “melhor ferramenta de gestão de projetos para agências.”

Quando o ChatGPT processa esses prompts, ele gera de 2 a 4 “consultas ramificadas” (fan-out queries) para pesquisar a web. São a interpretação do modelo sobre o que você perguntou, traduzida em consultas no estilo de buscadores para recuperar material-fonte.

O estudo verificou se as fontes citadas pelo ChatGPT apareciam nos resultados do Google ou do Bing para essas mesmas consultas ramificadas.

O achado central: 27% das fontes citadas apareciam em qualquer posição nas 10 primeiras páginas do Google para a consulta ramificada correspondente. No Bing, 23%. Com sobreposição de cerca de 10% entre os dois buscadores, o alcance combinado ficou em torno de 40%.

Restam 60% das fontes citadas pelo ChatGPT invisíveis para ambos os buscadores.

Por Que Esse Número Importa

SEO é governável. Organizações acumulam 25 anos de entendimento sobre como o Google ranqueia conteúdo. Podem auditar posições, acompanhar mudanças, testar hipóteses e fazer correções. O ciclo de feedback é lento, mas existe.

Citação por IA não tem ciclo de feedback equivalente.

Você não sabe quais prompts os usuários digitam. Não sabe quais consultas ramificadas o modelo gera a partir desses prompts. Não consegue ver o índice de recuperação contra o qual o ChatGPT pesquisa. E mesmo que pudesse observar os três, a sobreposição de 27% com o Google significa que ranquear bem em busca é um preditor fraco de citação por IA.

A primeira página do Google concentrou um terço de todas as correspondências no estudo. Para os primeiros resultados, a correlação é significativa. Depois disso, cai abruptamente. E para 20 dos 100 prompts testados, não houve nenhuma sobreposição entre as citações do ChatGPT e os resultados de qualquer buscador. Zero. Um conjunto completamente diferente de fontes.

Apenas um prompt em 100 teve sobreposição completa.

A Camada de Alucinação

O estudo identificou que aproximadamente 10% das citações do ChatGPT levavam a páginas de erro. A URL citada não existia. Isso converge com pesquisas acadêmicas que mostram taxas de alucinação acima de 14% em tarefas de citação.

Isso adiciona uma segunda dimensão ao problema de governança. Organizações não conseguem prever quais fontes reais a IA vai citar. Também não podem assumir que citações apontando para seu domínio são precisas. Uma URL alucinada com o nome do seu domínio cria uma experiência quebrada que você não autorizou e não consegue corrigir.

O Que Isso Significa para Estratégia de Conteúdo

O instinto será tratar isso como um problema de SEO com novas variáveis. Não é.

SEO opera sobre a premissa de descobribilidade: crie conteúdo, otimize para sinais conhecidos, meça o ranqueamento, itere. Citação por IA opera sobre a premissa de seleção: o modelo recupera de um pool que você não vê, aplica critérios que você não audita e gera consultas que você não prevê. Otimização sem observabilidade é suposição.

Considere os números específicos. 78% das fontes citadas no estudo eram “conteúdo típico de SEO.” Organizações que já produzem conteúdo estruturado e substancial estão no pool. Mas estar no pool e ser selecionado são problemas diferentes. Quando se mede correspondência por domínio (ignorando URL exata) em vez de URL exata, a sobreposição com o Google salta de 27% para cerca de 50%. Seu domínio importa mais que sua página específica. Ainda assim, metade das citações vem de fontes sem presença alguma em buscadores.

17 dos 100 prompts não acionaram nenhuma pesquisa web. O ChatGPT respondeu exclusivamente a partir dos dados de treinamento. Para essas consultas, nenhuma otimização de conteúdo atual faz diferença. O modelo já formou sua resposta com conteúdo ingerido meses ou anos atrás.

A Questão de Governança

Artigos anteriores nesta série argumentaram que organizações precisam governar sua visibilidade em IA com a mesma deliberação com que governam visibilidade em busca. Esses dados quantificam por que o argumento é mais urgente do que parecia.

O modelo mental de SEO pressupõe um sistema transparente e auditável onde causa e efeito podem ser rastreados. O Google publica diretrizes. Fatores de ranqueamento são estudados e documentados. Ferramentas de monitoramento de posição existem. Nenhuma dessa infraestrutura existe para citação por IA. O sistema é opaco por design, não por acidente.

Três implicações de governança seguem.

Monitoramento precisa ir além de ranqueamento em busca. Se 60% das citações de IA vêm de fontes invisíveis para buscadores, acompanhar sua posição no Google conta menos da metade da história. Organizações precisam monitorar o que sistemas de IA efetivamente dizem sobre elas, seus produtos e sua categoria. Isso requer observação direta das saídas da IA, não mensuração indireta via busca.

Estratégia de conteúdo se torna estratégia de marca. O sinal de domínio (50% de sobreposição ao medir por domínio em vez de URL) sugere que autoridade de domínio em sistemas de IA opera de forma diferente da busca. Construir autoridade reconhecida sobre um tema, em vez de otimizar páginas individuais para consultas específicas, pode importar mais. Isso se aproxima mais de construção de marca do que de SEO.

Aceitar cegueira parcial é em si uma decisão de governança. Organizações não conseguem controlar totalmente, nem sequer observar, como a IA as representa. Fingir o contrário gera falsa confiança. A postura honesta de governança é reconhecer a opacidade, investir no monitoramento possível e construir conteúdo resiliente o suficiente para performar em sistemas de recuperação conhecidos e desconhecidos.

O Que Organizações Devem Fazer

Comece separando o que você pode medir do que não pode.

Você pode medir o que sistemas de IA dizem sobre você hoje. Rode seus próprios prompts de intenção de compra. Registre as citações. Acompanhe ao longo do tempo. É rudimentar, mas estabelece uma linha de base que ranqueamento em busca sozinho não fornece.

Você pode medir presença em nível de domínio. Se seu domínio aparece em citações de IA mesmo quando URLs específicas não correspondem a resultados de busca, sua marca carrega peso no sistema de recuperação. Se não aparece, você tem um déficit de visibilidade que nenhuma otimização de página isolada vai resolver.

Você não pode medir o índice de recuperação completo, a lógica de geração de consultas internas, nem os critérios de seleção. Não construa estratégias que pressuponham que pode.

A vantagem competitiva pertence às organizações que aceitam essas restrições cedo e constroem monitoramento, conteúdo e práticas de governança em torno delas. As demais continuarão otimizando para um sistema que explica menos de um terço do que a IA efetivamente faz.

Fontes

Grow and Convert. “Fan-Out Query SERP Study.” Março 2026.
“Hallucination research.” Fevereiro 2026.

A Victorino ajuda organizações a construir estratégias de governança de conteúdo para a era da descoberta mediada por IA: contato@victorino.com.br | www.victorino.com.br