DeepSeek : premières répliques du tremblement de terre

DeepSeek face à la contre-attaque • Qant, M. de R. avec Midjourney

La start-up chinoise DeepSeek fait face à des enquêtes en Europe et aux États-Unis, ainsi qu’à des accusations de violation de propriété intellectuelle par OpenAI, qui se retrouve ainsi dans la position de l’arroseur arrosé.

  • COPIEUR ! David Sacks, conseiller de Donald Trump pour l’intelligence artificielle et les cryptomonnaies, a affirmé hier sur Fox News qu’il existe des preuves que DeepSeek aurait utilisé des réponses d’OpenAI pour entraîner son modèle, ce qui soulève des questions de propriété intellectuelle.
  • Des chercheurs en cybersécurité de Microsoft auraient détecté une extraction massive de données via des comptes développeurs OpenAI fin 2024, potentiellement liés à DeepSeek.
  • OpenAI a confirmé hier au Financial Times qu'elle soupçonnait DeepSeek d’avoir utilisé ses modèles d’IA pour entraîner ses propres solutions. Elle affirme également avoir trouvé des preuves de distillation, une technique qui permet de former des modèles plus petits à partir de modèles plus avancés, en violation de ses conditions d’utilisation.

Un utilisateur de DeepSeek contourne la censure à propos du président chinois Xi Jinping • Source : @_SaxX_

  • EN EUROPE, la coalition des groupes de défense des consommateurs en Europe Euroconsumers a saisi l’Autorité italienne de protection des données sur la gestion des informations personnelles par DeepSeek.
  • La Garante, qui avait temporairement bloqué ChatGPT en 2023 pour non-respect du RGPD (lire Qant du 31 mars 2023), a déjà demandé des explications à DeepSeek, estimant que les données de millions d’Italiens sont à risque.
  • La start-up chinoise a 20 jours pour répondre aux questions des autorités italiennes, qui se retrouvent confrontées au même dilemme qu’avec ChatGPT : la capacité de l’Italie à faire durablement cavalier seul et couper la Péninsule d’un modèle utilisé partout dans le monde semble très douteuse.
  • EN FILIGRANE : Hugging Face vient de lancer Open-R1, un projet visant à recréer le modèle R1 de DeepSeek, lui-même pourtant offert en open source sous une des licences les plus permissives qui soient, celle du MIT.
  • L’objectif est de documenter entièrement les étapes d’entraînement, les jeux de données utilisés et les choix effectués, afin de permettre aux chercheurs d’approfondir leurs travaux et d’accélérer l’apparition de nouveaux modèles.
  • À SURVEILLER : …La caravane qui passe. Il est douteux que les risques juridiques sur la propriété intellectuelle ou les gesticulations italiennes aient un effet plus dissuasif sur DeepSeek, une start-up chinoise, qu’elles n’en ont eu sur OpenAI elle-même. En revanche, l’accélération de la recherche dont témoigne Open-R1 aura pour effet d’accélérer la “commoditisation” des modèles d’IA et donc la pression sur les éditeurs américains. Cette nuit, en présentant les résultats trimestriels de Microsoft – qui propose désormais DeepSeek sur Azure –, Satya Nadella a évoqué l’hypothèse d’une réduction des investissements dans les datacenters à partir de juillet.

L’essentiel