A Infraestrutura de Governança da OpenAI Se Torna Pública

A OpenAI publicou dois documentos em março de 2026 que merecem atenção de quem trabalha com IA em contexto empresarial. O primeiro é o Model Spec, um framework que define como os modelos devem se comportar. O segundo é o Safety Bug Bounty, um programa que expande a caça de vulnerabilidades para cenários específicos de IA.

Separados, são documentos técnicos. Juntos, representam algo mais: a segunda grande empresa de IA tornando pública sua infraestrutura de governança. A Anthropic fez isso em janeiro com a Constituição do Claude. Agora a OpenAI segue o mesmo caminho, com uma abordagem diferente.

Model Spec: Governança Comportamental

O Model Spec é a resposta da OpenAI para uma pergunta que toda empresa usando IA precisa responder: quando instruções conflitam, quem manda?

A solução proposta é uma Cadeia de Comando. Na prática, funciona assim: o modelo recebe instruções da OpenAI (nível mais alto), dos operadores (empresas que integram a API) e dos usuários finais. Quando essas instruções entram em conflito, a hierarquia resolve. Instruções da OpenAI prevalecem sobre as do operador, que prevalecem sobre as do usuário.

Para quem trabalha com agentes em produção, essa estrutura é familiar. É o mesmo princípio de qualquer sistema de permissões: quem está mais alto na cadeia tem autoridade sobre quem está abaixo. A diferença é que aqui a “permissão” não é acesso a um recurso. É comportamento.

O Model Spec inclui rubrics de decisão e auxílios interpretativos para casos ambíguos. São cenários onde a resposta correta não é óbvia e o modelo precisa de orientação sobre como ponderar valores concorrentes. Segurança contra utilidade. Transparência contra privacidade do operador. Obediência contra ética.

Como exploramos na análise da Constituição do Claude, a Anthropic resolveu esse problema com uma hierarquia de quatro prioridades: segurança, ética, conformidade, utilidade. A OpenAI faz algo similar com a Cadeia de Comando, mas o ângulo é diferente. Enquanto a Anthropic parte de valores, a OpenAI parte de papéis.

Essa diferença não é trivial.

Valores vs. Papéis: Duas Filosofias de Governança

A Constituição da Anthropic define o que o modelo valoriza. Quando encontra um conflito, consulta seus princípios e raciocina sobre o que é certo. É governança baseada em caráter. O modelo internaliza valores e os aplica a situações novas.

O Model Spec da OpenAI define quem tem autoridade. Quando encontra um conflito, consulta a hierarquia e segue a instrução de quem tem prioridade. É governança baseada em estrutura. O modelo segue regras de precedência.

Para empresas, as duas abordagens têm implicações práticas diferentes.

Governança por valores escala melhor para cenários imprevistos. Se o modelo entende por que certa ação é problemática, consegue generalizar para situações que ninguém antecipou. O risco: valores são interpretáveis. Dois modelos podem chegar a conclusões diferentes sobre o mesmo cenário.

Governança por papéis é mais previsível. Se a hierarquia está clara, o resultado é determinístico. O risco: rigidez. Cenários não previstos pela hierarquia ficam sem resolução clara.

Na prática, a maioria das empresas vai precisar dos dois. Hierarquia para decisões operacionais (quem pode instruir o modelo a fazer o quê). Valores para decisões éticas (o que o modelo se recusa a fazer independente de quem pede).

Safety Bug Bounty: Segurança Como Superfície Viva

O segundo artefato é o Safety Bug Bounty. Programas de bug bounty existem há décadas em software tradicional. A novidade aqui é a expansão do escopo para cenários que só existem em IA.

Três categorias se destacam.

Prompt injection: quando um atacante insere instruções maliciosas no contexto do modelo, fazendo-o ignorar suas regras. É o equivalente em IA de uma injeção SQL. Simples em conceito, devastador em escala.

Exfiltração de dados: quando o modelo é manipulado para revelar informações do contexto do operador ou de outros usuários. Em agentes com acesso a bases de dados corporativas, o risco é concreto.

Vulnerabilidades agênticas: quando um agente autônomo é comprometido durante uma cadeia de ações. O atacante não precisa quebrar o modelo. Basta comprometer um dos passos intermediários.

Como argumentamos ao analisar a convergência entre governança e cibersegurança, essas categorias confirmam que segurança de IA não é um domínio separado. É cibersegurança aplicada a um novo tipo de sistema.

O mérito da OpenAI é reconhecer isso formalmente e criar incentivos econômicos para que pesquisadores externos encontrem falhas antes que atacantes as explorem.

O Que Isso Significa Para Empresas

Duas das maiores empresas de IA do mundo publicaram seus frameworks de governança em menos de três meses. Não fizeram isso por altruísmo. Fizeram porque governança pública é pré-requisito para adoção empresarial séria.

Nenhum CISO aprova a integração de um modelo de linguagem em infraestrutura corporativa sem entender como ele toma decisões. Nenhum conselho de administração autoriza agentes autônomos sem saber quais são os limites. Publicar o Model Spec é a OpenAI dizendo: “Aqui está como nosso modelo se comporta. Auditem.”

Para quem está construindo sistemas com IA, três lições práticas.

Primeiro: defina sua própria cadeia de comando. Quem pode instruir seus agentes? Que tipo de instrução cada nível pode dar? O Model Spec é um template útil, não porque você deva copiá-lo, mas porque força as perguntas certas.

Segundo: trate segurança de IA como superfície de ataque contínua. O Safety Bug Bounty da OpenAI não é um evento. É um programa permanente. Seus sistemas de IA precisam do mesmo tratamento: monitoramento contínuo, testes adversariais recorrentes, processos de resposta a incidentes específicos para IA.

Terceiro: não escolha entre valores e estrutura. Use os dois. Hierarquia para o operacional. Princípios para o ético. Documente ambos. Torne-os auditáveis.

A era em que governança de IA era um slide de PowerPoint acabou. Agora é código, é documento público, é infraestrutura. As empresas que tratarem governança como engenharia vão operar IA em produção. As que tratarem como compliance vão ficar reescrevendo políticas que ninguém segue.

Fontes

OpenAI. “Inside Our Approach to the Model Spec.” Março 2026.
OpenAI. “Introducing the OpenAI Safety Bug Bounty Program.” Março 2026.

Victorino Group ajuda empresas a construir frameworks de governança para sistemas de IA. contato@victorino.com.br | www.victorino.com.br