DeepSeek et la guerre des prix

Guerre des prix entre les modèles • Qant, M. de R. avec Midjourney

L’impact de DeepSeek sur la baisse des coûts de l’IA est indéniable, mais ses économies ont été largement surestimées.

L’annonce d’un coût d’entraînement de seulement 6 millions de dollars pour DeepSeek V3 a marqué les esprits. Certains y ont vu une rupture majeure dans l’économie des modèles d’IA, prouvant qu’il était possible d’entraîner des intelligences artificielles avancées pour une fraction du coût habituel. Pourtant, cette estimation ne reflète qu’une partie de la réalité.

En analysant les dépenses globales de DeepSeek, l’institut Semi Analysis découvre une situation bien différente. Loin de s’appuyer uniquement sur des optimisations techniques, l’entreprise a mobilisé des ressources considérables, notamment en infrastructures et en recherche, pour atteindre ses performances actuelles.

Des coûts bien plus élevés qu’annoncé

Les 6 millions de dollars avancés par DeepSeek ne couvrent que le pré-entraînement brut du modèle, soit la phase durant laquelle le modèle absorbe un immense volume de données pour développer ses capacités de base. Ce chiffre ne tient pas compte de nombreux autres postes de dépenses essentiels, comme le développement des architectures, la collecte et le nettoyage des données, ou encore les salaires des ingénieurs.

DeepSeek a investi massivement depuis sa création. Son budget matériel dépasse les 500 millions de dollars et le coût de fonctionnement de son infrastructure atteint environ 944 millions. Comparé aux modèles concurrents, comme Claude 3.5 Sonnet d’Anthropic, dont l’entraînement aurait nécessité « des dizaines de millions » de dollars, l’écart est moins significatif qu’il n’y paraît.

DeepSeek a su optimiser certaines étapes du processus, mais il n’a pas fondamentalement réduit les coûts d’entraînement des modèles d’IA. L’idée d’une révolution budgétaire relève donc plus du récit médiatique que d’un bouleversement technologique avéré.

Un marché en pleine déflation

La baisse des prix de l’IA • Source : Latent Space

En revanche, l’annonce de DeepSeek R1 a révélé une course à la baisse des prix qui ne fait que s’accélérer. Quelques jours seulement après la sortie de DeepSeek R1, OpenAI a annoncé que son modèle o3-mini serait accessible gratuitement. Google a suivi une approche similaire avec Gemini 2.0 Flash Thinking, dont l’accès libre suggère une volonté de s’aligner sur cette nouvelle dynamique tarifaire.

Distillation des prix

L’impact de DeepSeek ne se limite pas aux modèles premium. Grâce aux progrès des techniques de distillation, il est désormais possible de transformer des modèles plus petits en agents extrêmement performants. Un modèle de seulement 1,5 milliard de paramètres, entraîné avec les techniques de DeepSeek, parvient déjà à surpasser Claude 3.5 Sonnet et GPT-4o sur certaines tâches. Cette évolution pourrait redistribuer les cartes en favorisant des IA plus légères, moins coûteuses.

DeepSeek ne se contente pas d’influencer le marché par ses performances techniques. L’entreprise a adopté une approche commerciale particulièrement agressive, en proposant ses inférences presque 30 fois moins cher qu’OpenAI. Elle force ses rivaux à en faire autant, chacun tentant d’imposer son écosystème et capturer ou défendre une part de marché significative.

L’impact de cette nouvelle dynamique dépasse largement le cas de DeepSeek. Avec des budgets d’entraînement divisés par dix en l’espace d’un an et l’amélioration constante des algorithmes, l’industrie de l’IA est en train de basculer vers un nouveau paradigme.

Pour en savoir plus :

L’essentiel