Metáfora visual mostrando dados corporativos escapando por uma brecha entre um notebook corporativo bloqueado e um celular pessoal, representando o conceito de "Paste Gap" (Lacuna do Colar) central ao artigo.

Artificial IntelligenceCybersecurityEnterprise Technology

Seus Funcionários Já Estão Vazando Seus Segredos para o ChatGPT — e Bani-lo Só Piorou Tudo

Ashutosh Singhal 30 de janeiro de 202613 min

Eu estava sentado diante de um CISO de uma grande empresa de serviços financeiros quando ele disse algo que ficou comigo por semanas. Ele se recostou, esfregou as têmporas e disse: "Bloqueamos o ChatGPT em todos os dispositivos que gerenciamos. Atualizamos a política de uso aceitável. Enviamos três e-mails para toda a empresa. E na última terça-feira, descobri que toda a nossa equipe de fusões e aquisições vem colando termos de negociações no Claude nos celulares pessoais durante o almoço."

Ele não estava com raiva. Estava exausto. Havia feito tudo o que a cartilha de cibersegurança mandava, e não tinha funcionado.

Aquela conversa cristalizou algo que eu vinha observando em cada projeto empresarial que minha equipe na Veriprajna havia assumido: banir a IA generativa não impede que as pessoas a usem — apenas faz com que a escondam. E o uso escondido é infinitamente mais perigoso do que o uso visível. Os dados contam a mesma história. Quarenta e seis por cento dos funcionários dizem que continuariam usando ferramentas de IA mesmo que sua empresa as proibisse explicitamente. Trinta e oito por cento admitem que já compartilharam dados de trabalho sensíveis com plataformas públicas de IA sem contar a ninguém. O volume de dados que flui para aplicativos de IA generativa aumentou trinta vezes ano a ano. Isto não é um problema de política. É um problema de arquitetura.

A Noite em que a Samsung Mudou Tudo

Em maio de 2023, três engenheiros da divisão de semicondutores da Samsung fizeram algo completamente racional. Estavam depurando código proprietário de fabricação de chips — trabalho complexo e de alto risco, onde uma segunda opinião poderia economizar dias de esforço. Então colaram seu código no ChatGPT.

Um deles fez upload de código-fonte de bancos de dados de medição de semicondutores. Outro compartilhou a lógica de um programa para identificar defeitos de rendimento — o tipo de dado que impacta diretamente o preço das ações da Samsung. Um terceiro fez upload da gravação de uma reunião interna para gerar a ata.

Nenhum deles estava tentando prejudicar a empresa. Estavam tentando fazer bem o seu trabalho. Trataram o ChatGPT do jeito que você trataria uma calculadora: coloca algo, obtém algo, segue em frente. O que eles não compreenderam plenamente foi que os termos de serviço da OpenAI na época permitiam que os dados de entrada fossem retidos — potencialmente usados para treinar o modelo, definitivamente armazenados em servidores fora do controle da Samsung.

Lembro de ler a cobertura da notícia e sentir um nó no estômago. Não porque o vazamento fosse surpreendente — eu vinha alertando clientes sobre exatamente esse cenário — mas porque a resposta da Samsung foi tão previsível. Eles emitiram uma proibição para toda a empresa. Ameaçaram demitir por violações. Bloquearam a rede.

E eu sabia, com absoluta certeza, que não funcionaria.

Por Que Banir a IA Sempre Sai pela Culatra?

Eis o que a maioria das equipes de segurança erra: elas modelam a ameaça como se os funcionários fossem adversários. Construa um muro mais alto, e o problema desaparece. Mas as pessoas que vazam dados para o ChatGPT não são adversárias. São seus melhores talentos.

Pense em quem realmente usa ferramentas de IA no trabalho. Não é a pessoa que leva o dia na flauta. É o engenheiro que está sob pressão para entregar até sexta-feira. O analista que precisa resumir quarenta páginas de due diligence até de manhã. O desenvolvedor que sabe que a IA consegue detectar em segundos um bug que levaria uma hora para ser encontrado manualmente.

Quando você bane a ferramenta, está dizendo às suas pessoas mais produtivas: "Seja mais lento. Seja menos eficaz. Veja seus concorrentes te ultrapassarem, e aceite isso." É claro que elas não obedecem. Simplesmente mudam para os celulares pessoais. Usam hotspots 4G para contornar a rede corporativa. Encontram um dos mais de 317 aplicativos distintos de IA generativa que a Netskope rastreou em ambientes corporativos — porque, mesmo que você bloqueie OpenAI, Google e Anthropic, há centenas de alternativas menores e menos seguras à espera.

Quando a segurança é percebida como um obstáculo em vez de um facilitador, seus funcionários mais conscienciosos se tornam os principais violadores das políticas.

Comecei a chamar isso de "Lacuna do Colar" (Paste Gap) nas conversas com minha equipe. Os dados saem do notebook corporativo seguro, viajam para um dispositivo pessoal e são colados em um serviço de nuvem pública. Nenhum firewall os captura. Nenhum CASB os registra. É invisível. E está acontecendo agora mesmo, em toda organização que tentou resolver esse problema com um memorando de política.

Os números são impressionantes: um aumento de 485% em código-fonte proprietário sendo colado em ferramentas de IA. Setenta e dois por cento do uso empresarial de IA acontecendo por meio de contas pessoais, completamente fora da visibilidade da TI. Isto não é um filete. É uma enchente, e os diques são feitos de papel.

O Que Eu Entendi Errado Sobre os Níveis "Empresariais" de IA

Vou ser honesto — quando a OpenAI lançou o ChatGPT Enterprise, achei que talvez fosse o suficiente. Retenção zero de dados. Sem treinamento com dados de negócios. Conformidade SOC 2. Marcava todos os quesitos.

Então começamos a fazer uma diligência mais profunda para nossos clientes, e as rachaduras apareceram.

Mesmo os contratos empresariais normalmente incluem uma janela curta de retenção de dados — muitas vezes trinta dias — para monitoramento de abusos. São trinta dias em que seus prompts mais sensíveis ficam nos servidores de outra pessoa. E "outra pessoa" é uma empresa sediada nos EUA, o que nos leva a um problema que tira o sono dos CISOs europeus.

O US CLOUD Act — a Lei de Esclarecimento sobre o Uso Legal de Dados no Exterior (Clarifying Lawful Overseas Use of Data Act) — permite que as autoridades policiais dos EUA obriguem empresas de tecnologia americanas a entregar dados armazenados em seus servidores, independentemente de onde esses servidores estejam fisicamente localizados. Se um banco alemão usa o Azure OpenAI com um data center em Frankfurt, os dados podem estar "em repouso" na UE, mas a entidade jurídica controladora ainda está sujeita a mandados dos EUA. Durante a inferência — quando o modelo de fato processa seus dados — eles ainda podem trafegar por uma infraestrutura controlada pelos EUA.

Vi uma sala cheia de responsáveis por conformidade empalidecer quando os conduzi por esse raciocínio. Eles haviam assinado o contrato empresarial achando que tinham resolvido o problema da soberania. Sequer haviam arranhado a superfície.

Escrevi sobre esse problema de arquitetura — e o modelo de ameaças completo — em nosso whitepaper interativo sobre Shadow AI e LLMs corporativos privados. Ele nasceu exatamente dessas conversas.

A Armadilha do Wrapper

Por volta da mesma época, minha caixa de entrada começou a se encher de propostas de consultorias de IA. "Vamos construir uma solução de IA personalizada para você!" A maioria delas eram wrappers — uma interface bonita parafusada por cima da API da OpenAI, talvez com um prompt de sistema dizendo "Você é um assistente jurídico prestativo."

Assisti a uma demonstração em que o fornecedor mostrava orgulhosamente uma "plataforma de IA proprietária" para análise de contratos. Fiz uma única pergunta: "Para onde vão os dados quando um usuário faz upload de um contrato?" Silêncio. Depois: "Bem, eles vão para a API da OpenAI, mas temos um BAA em vigor."

Isso não é uma solução. É um intermediário adicionando latência ao seu vazamento de dados.

Um wrapper não resolve o problema da soberania de dados. Apenas embeleza a interface da saída dos dados.

Os wrappers falham com as empresas de três maneiras específicas. Primeiro, são trivialmente replicáveis — se a sua "solução de IA" é um prompt mais uma chave de API, seu estagiário consegue reconstruí-la em uma tarde. Segundo, carecem de integração profunda com seus dados reais, tendo dificuldade com as nuances da terminologia específica da empresa, bases de código legadas ou controles de acesso. Terceiro — e este é o golpe fatal — eles ainda enviam seus dados pela internet pública para um provedor terceirizado. O risco de segurança não mudou. Você apenas adicionou um logotipo a ele.

O Que "Ser Dono da Inteligência" Realmente Significa?

Um diagrama de arquitetura comparando três abordagens — API/wrapper público, nível de API empresarial e LLM privado auto-hospedado — mostrando por onde os dados trafegam em cada cenário.

Houve um momento específico em que nossa abordagem na Veriprajna cristalizou. Estávamos trabalhando com um cliente de um setor regulado — não posso dizer qual, mas pense em "o tipo de dado cujo vazamento vira notícia no jornal da noite." A equipe jurídica havia acabado de barrar um piloto promissor de IA porque ele dependia de uma API pública. A equipe de engenharia estava furiosa. A unidade de negócios ameaçava agir por conta própria e construir a sua própria coisa com contas pessoais.

Eu estava em uma ligação com meu arquiteto-chefe, e ele disse algo simples: "Por que estamos discutindo qual API usar? Deveríamos simplesmente rodar o modelo nós mesmos."

Foi aí que nos comprometemos totalmente com o que agora chamo de Deep AI — implantar modelos de linguagem de grande porte de código aberto diretamente dentro da própria infraestrutura do cliente. Não envolver o modelo de outra pessoa. Não alugar inteligência por token. De fato ser dono dela.

Eis como isso funciona na prática. Você pega um modelo de pesos abertos de alto desempenho — o Llama 3 da Meta, por exemplo, cuja versão de 70B de parâmetros rivaliza com o GPT-4 em muitos benchmarks — e o implanta em instâncias de GPU dentro da Nuvem Privada Virtual do cliente. Os pesos do modelo residem em hardware que o cliente controla. O motor de inferência roda por trás do firewall corporativo. Quando um desenvolvedor envia um prompt ao modelo com código proprietário, esse código viaja do notebook dele para um servidor interno, é processado na memória e volta. Nunca toca a internet pública. Nunca aterrissa em um servidor terceirizado.

Combinamos isso com o que chamamos de Private RAG — Geração Aumentada por Recuperação construída sobre bancos de dados vetoriais implantados dentro do mesmo ambiente seguro. Os documentos da empresa são ingeridos, incorporados (embedded) e armazenados localmente. E, de forma crítica, o sistema respeita os controles de acesso existentes. Se você não tem permissão para ver um documento no SharePoint, a IA também não vai recuperá-lo para responder à sua pergunta. Aquele problema de "autorização plana" — em que um chatbot expõe acidentalmente dados confidenciais a qualquer um que peça — simplesmente não existe nesta arquitetura.

Como Você Torna um Modelo Bruto de Nível Empresarial?

Uma das lições mais difíceis que aprendemos cedo: implantar um modelo é talvez trinta por cento do trabalho. Torná-lo seguro para que milhares de funcionários o usem todos os dias — esses são os outros setenta.

Modelos de linguagem brutos são imprevisíveis. Eles vão alegremente discutir assuntos que não deveriam, gerar conteúdo que viola a política da empresa ou responder a injeções de prompt engenhosas concebidas para burlar os protocolos de segurança. Você precisa de guardrails — essencialmente um firewall para prompts.

Implementamos o NVIDIA NeMo Guardrails como uma camada programável em torno do modelo. Antes de um prompt chegar ao modelo, ele é escaneado. Se alguém digita um número de CPF ou de cartão de crédito, o guardrail o intercepta. Se alguém pergunta a um bot de RH sobre senhas de banco de dados, o sistema reconhece a incompatibilidade de intenção e recusa. Se alguém tenta um ataque de jailbreak — aqueles truques de "ignore todas as instruções anteriores" — a camada de defesa o intercepta.

Lembro de um teste de penetração que executamos em uma de nossas primeiras implantações. Nossa equipe red team passou dois dias tentando extrair dados de treinamento ou burlar restrições de tópico. Foram criativos — prompts aninhados de dramatização (role-play), instruções codificadas, o pacote completo. Os guardrails aguentaram firme. Meu arquiteto me enviou um print do log de tentativas bloqueadas às 2 da manhã com uma única mensagem: "O muro está sólido." Foi uma boa noite.

Para o detalhamento técnico completo desta arquitetura — a pilha de inferência, a configuração do banco de dados vetorial, a implementação dos guardrails — veja nosso mergulho técnico aprofundado sobre segurança de IA empresarial.

"Mas as GPUs São Caras e as APIs São Baratas"

Um infográfico de comparação de custos mostrando como os custos de API escalam de forma linear enquanto os custos de auto-hospedagem permanecem relativamente estáveis, com os principais pontos de dados do artigo.

Esta é a objeção que mais ouço dos CFOs, e ela está errada de uma forma que vale a pena destrinchar.

Sim, o preço da API parece barato na superfície — frações de centavo por token. Mas as aplicações de RAG empresarial são vorazmente famintas por tokens. Para responder a uma única pergunta, o sistema pode recuperar dez páginas de contexto como tokens de entrada. Multiplique isso por mil funcionários fazendo dez perguntas por dia, e você está diante de US$ 1.000 a US$ 3.000 por dia. Isso é potencialmente um milhão de dólares por ano, e escala de forma linear. Se a adoção dobra, a conta dobra.

Os modelos auto-hospedados funcionam de forma diferente. Você paga pelo hardware — aluguel ou compra de GPU — e pela eletricidade. Um único nó bem configurado consegue lidar com milhares de requisições por segundo. Até você saturar esse nó, o custo marginal do próximo token é efetivamente zero. Para uma empresa de médio porte processando um bilhão de tokens por mês, vimos a auto-hospedagem sair de 50 a 70 por cento mais barata do que os custos equivalentes de API, com a privacidade como bônus gratuito.

E há custos ocultos nas APIs que nunca aparecem na fatura. Limites de taxa que causam quedas durante lançamentos para toda a empresa. Descontinuações de modelos que forçam você a retestar cada prompt e fluxo de trabalho quando o provedor aposenta uma versão. Com um modelo auto-hospedado, nada muda a menos que você decida atualizá-lo. Você ganha estabilidade. Ganha previsibilidade. Ganha o direito de parar de se preocupar com o que o comitê de precificação da OpenAI vai decidir no próximo trimestre.

Em escala empresarial, a auto-hospedagem não é a opção cara. É a que não te leva à falência quando a adoção dá certo.

Por Que Nem Todo Mundo Já Está Fazendo Isso?

As pessoas me perguntam isso, e a resposta honesta é: é difícil. Não conceitualmente — a lógica é direta — mas operacionalmente. Você precisa de pessoas que entendam de orquestração de GPU com Kubernetes, que saibam configurar o vLLM para obter a vazão ideal, que saibam construir pipelines de recuperação cientes de RBAC, que consigam implementar guardrails rígidos o suficiente para evitar o mau uso, mas flexíveis o suficiente para não frustrar os usuários.

A maioria das empresas não tem essa equipe. A maioria das consultorias de IA também não — elas sabem chamar uma API, não implantar uma pilha de inferência. Essa é a lacuna que preenchemos na Veriprajna. Não vendemos acesso a um modelo. Construímos a capacidade de rodar modelos de forma independente. Quando vamos embora, o cliente é dono de tudo — os pesos do modelo ajustado (fine-tuned), os índices vetoriais, a infraestrutura de orquestração. Tudo é dele. É esse o objetivo todo.

A outra coisa que retarda a adoção é a inércia. O CISO que bloqueou o ChatGPT sente que fez alguma coisa. Admitir que a proibição não funcionou significa admitir que o último ano de aplicação de políticas foi teatro. Essa é uma conversa difícil de ter com um conselho de administração. Mas a alternativa — fingir que o problema não existe enquanto os funcionários colam código-fonte em contas pessoais de IA — é pior. Não é uma questão de se o próximo vazamento em escala Samsung vai acontecer. É quando, e se vai acontecer com você.

O Sinal Escondido na Shadow AI

Eis o que acho que a maioria das pessoas não percebe sobre a epidemia da Shadow AI: não é apenas um problema de segurança. É um sinal. Um sinal alto e inconfundível de que sua força de trabalho está desesperada por ferramentas melhores e disposta a arriscar o emprego para obtê-las.

Quarenta e seis por cento dos funcionários dizem que desafiariam uma proibição explícita. Isso não é desafio por desafio. São pessoas dizendo a você, por meio de suas ações, que a IA se tornou essencial para a forma como trabalham. A questão não é se sua organização vai usar IA generativa. Essa decisão já foi tomada — pelos seus funcionários, sem a sua permissão, nos dispositivos pessoais deles, durante o almoço.

A única pergunta que resta é se você vai oferecer uma maneira segura de fazer o que eles já estão fazendo de forma insegura.

A Shadow AI é sua força de trabalho votando com as teclas que digita. Eles escolheram a IA. Agora você escolhe: visível e seguro, ou invisível e vazando dados.

Já superamos a era em que "não" era uma estratégia de IA aceitável. Os modelos de código aberto são bons o suficiente. A infraestrutura de implantação está madura o suficiente. A economia funciona. A única coisa que separa a maioria das empresas de uma capacidade soberana de IA é a disposição de parar de fingir que a proibição funciona.

Você não precisa banir a IA. Você precisa ser dono dela.

Related Research

IA Soberana & Implantação de LLM Privado | VeriprajnaSolution Page

The Illusion of Control: Shadow AI & Private Enterprise LLMs | VeriprajnaInteractive Whitepaper

The Illusion of Control: Securing Enterprise AI with Private LLMsTechnical Deep-Dive

Also Published On

LinkedIn · Company LinkedIn · Founder YouTube Medium Instagram Facebook X