Chatgpt Maker soupçonne que les modèles de l'IA profonde de la terre chinoise pas cher ont été construits à l'aide de données Openai - et l'ironie n'est pas perdue sur Internet Actualités - Dernières mises à jour et informations

OpenAI a exprimé ses préoccupations selon lesquelles les modèles de l'IA profonde de la Chine, connus pour leur coût remarquablement bas, peuvent avoir été développés à l'aide de données d'OpenAI. Cette semaine, Donald Trump a qualifié Deepseek de réveiller pour l'industrie de la technologie américaine, à la suite d'une baisse significative de la valeur marchande de Nvidia - de 600 milliards de dollars - déclenchés par l'émergence de Deepseek.

Les débuts de Deepseek ont envoyé des ondes de choc dans le secteur de l'IA, entraînant une forte baisse des cours des actions des principaux joueurs de l'IA. Nvidia, une force dominante dans la technologie GPU cruciale pour le développement du modèle d'IA, a subi la perte la plus substantielle de l'histoire de Wall Street, avec une baisse de partage de 16,86%. Microsoft, Meta Platforms, Alphabet (la société mère de Google) et Dell Technologies ont également connu des baisses, allant de 2,1% à 8,7%.

Deepseek promeut son modèle R1 en tant qu'alternative beaucoup moins chère aux offres d'IA occidentales comme Chatgpt. Construit sur la profondeur open-source-v3, il aurait besoin de moins de puissance de calcul et avait un coût de formation estimé à seulement 6 millions de dollars - une réclamation qui a été contestée par certains. Quelle que soit la précision de ce chiffre de coûts, Deepseek a soulevé des questions sur les milliards investis par des entreprises technologiques américaines dans l'IA, des investisseurs troublants. L'efficacité perçue du modèle l'a propulsé en haut des tableaux de téléchargement d'application gratuits américains.

Bloomberg a rapporté qu'Openai et Microsoft étudient si Deepseek a utilisé l'API d'Openai pour intégrer les modèles d'IA d'Openai dans ses propres. OpenAI a déclaré à Bloomberg qu'il était au courant des efforts des Chinois et d'autres sociétés pour extraire des données de la direction de sociétés américaines d'IA. Cette technique de «distillation», une violation des conditions d'utilisation d'OpenAI, implique la formation de modèles d'IA en extraitant des données de modèles plus grands et plus capables.

OpenAI a souligné son engagement à protéger sa propriété intellectuelle, y compris une sélection minutieuse des capacités incluses dans les modèles libérés, et a souligné l'importance de la collaboration avec le gouvernement américain pour protéger les modèles avancés à partir d'actions adversaires. David Sacks, le tsar de l'IA du président Donald Trump, a suggéré que Deepseek pourrait avoir utilisé cette méthode de distillation, une pratique dont OpenAI serait malheureux. Il prévoit que les principales sociétés d'IA mettront en œuvre des mesures pour empêcher de telles actions.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov / Bloomberg via Getty Images.

La situation met en évidence l'ironie de la position d'Openai, compte tenu des accusations selon lesquelles Chatgpt lui-même a été construit à l'aide de données grattées d'Internet. L'écrivain de PR Tech Ed Zitron a souligné cette hypocrisie sur Twitter.

La position précédente d'Openai sur l'utilisation du matériel protégé par le droit d'auteur dans la formation de l'IA complique encore le problème. Dans une soumission à la Chambre des Lords du Royaume-Uni, Openai a déclaré en janvier 2024 que la création d'outils d'IA comme Chatgpt sans matériel protégé par le droit d'auteur était "impossible". Cette déclaration fait suite à des poursuites du New York Times et de 17 auteurs, dont George RR Martin, alléguant l'utilisation illégale de leur travail protégé par le droit d'auteur. Openai soutient que ses pratiques de formation constituent une «utilisation équitable». Le paysage juridique entourant les données de formation de l'IA et le droit d'auteur reste complexe et contesté, souligné en outre par un bureau de droit d'auteur américain de 2018 selon lequel l'art généré par l'IA ne peut pas être protégé par le droit d'auteur.