O Openai manifestou preocupações de que os modelos Deepseek AI da China, conhecidos por seu custo notavelmente baixo, possam ter sido desenvolvidos usando dados do OpenAI. Nesta semana, Donald Trump chamou a DeepSeek de um alerta para a indústria de tecnologia dos EUA, após uma queda significativa no valor de mercado da NVIDIA-quase US $ 600 bilhões-traçado pelo emergência de Deepseek.
A estréia de Deepseek enviou ondas de choque pelo setor de IA, causando um declínio acentuado nos preços das ações dos principais jogadores da IA. A Nvidia, uma força dominante na tecnologia GPU crucial para o desenvolvimento do modelo de IA, sofreu a perda mais substancial na história de Wall Street, com uma queda de 16,86%. Microsoft, Meta plataformas, Alphabet (empresa controladora do Google) e Dell Technologies também sofreram declínios, variando de 2,1% a 8,7%.
A Deepseek promove seu modelo R1 como uma alternativa significativamente mais barata às ofertas ocidentais de IA como o ChatGPT. Construído sobre o Deepseek-V3 de código aberto, ele requer menos poder de computação e teve um custo de treinamento estimado de apenas US $ 6 milhões-uma reivindicação que foi contestada por alguns. Independentemente da precisão desse valor de custo, a Deepseek levantou questões sobre os bilhões investidos por empresas de tecnologia americanas na IA, investidores perturbadores. A eficácia percebida do modelo o impulsionou ao topo dos gráficos de download de aplicativos gratuitos dos EUA.
A Bloomberg relatou que o Openai e a Microsoft estão investigando se a DeepSeek utilizou a API do OpenAI para integrar os modelos de IA da OpenAI. O Openai afirmou à Bloomberg que está ciente dos esforços dos chineses e de outras empresas para extrair dados das empresas de IA lideradas. Essa técnica de "destilação", uma violação dos termos de serviço da OpenAI, envolve o treinamento de modelos de IA, extraindo dados de modelos maiores e mais capazes.
A OpenAI enfatizou seu compromisso de proteger sua propriedade intelectual, incluindo uma seleção cuidadosa de capacidades incluídas nos modelos liberados, e enfatizou a importância da colaboração com o governo dos EUA para proteger modelos avançados de ações adversárias. David Sacks, o czar da AI do presidente Donald Trump, sugeriu que a Deepseek possa ter empregado esse método de destilação, uma prática que o Openai está infeliz. Ele antecipa que as principais empresas de IA implementarão medidas para evitar tais ações.

A situação destaca a ironia da posição do OpenAI, dadas as acusações de que o próprio ChatGPT foi construído usando dados raspados da Internet. O escritor de relações públicas da tecnologia Ed Zitron destacou essa hipocrisia no Twitter.
A posição anterior da OpenAI sobre o uso de material protegido por direitos autorais no treinamento de IA complica ainda mais o problema. Em uma submissão à Câmara dos Lordes do Reino Unido, o Openai afirmou em janeiro de 2024 que a criação de ferramentas de IA como o ChatGPT sem material protegido por direitos autorais era "impossível". Esta declaração segue ações judiciais do New York Times e 17 autores, incluindo George RR Martin, alegando o uso ilegal de seu trabalho protegido por direitos autorais. O OpenAI sustenta que suas práticas de treinamento constituem "uso justo". O cenário legal em torno dos dados de treinamento da IA e direitos autorais permanece complexos e contestados, destacados por um escritório de direitos autorais dos EUA em 2018, que a arte gerada pela IA não pode ser protegida por direitos autorais.