AMD à la poursuite du leader

Le combat des puces • Qant, M. de R. avec Midjourney

Avec le lancement de son processeur Instinct MI325X, AMD s'attaque directement à Nvidia sur le marché des centres de données dédiés à l'intelligence artificielle. Grâce à une architecture avancée et une consommation d'énergie optimisée, la nouvelle puce d'AMD espère séduire les acteurs de l'IA en quête d'alternatives plus abordables et performantes.

AMD a présenté en fin de semaine dernière (lire Qant du 11 octobre) un nouveau processeur d'intelligence artificielle, l'Instinct MI325X, qui vise directement à concurrencer les GPU de la série Blackwell par Nvidia. Avec cette annonce, AMD cherche à renforcer sa présence dans le secteur de l'IA, dominé par Nvidia. Celui-ci détient notamment 90 % du marché des puces d’IA pour les datacenters, ce qui lui génère une confortable marge brute de 90 %.

Caractéristiques et architecture

L'Instinct MI325X repose sur une architecture baptisée CDNA3, qui permet de maximiser la puissance de calcul pour les tâches d'intelligence artificielle. Fabriquée avec les procédés de lithographie à 5 nanomètres et 6 nm de TSMC, ses composants sont très petits et denses. La puce contient 19 456 processeurs de flux, comparables à de petits moteurs de calcul, et 1 216 cœurs matriciels, spécialement optimisés pour le calcul tensoriel utilisé dans l'IA. Ces éléments sont répartis sur 304 unités de calcul. Avec une fréquence de pointe de 2100 MHz, le MI325X peut atteindre une puissance de calcul allant jusqu'à 2,61 pétaflops en précision FP8 et 1,3 pétaflops en FP16, deux formats numériques utilisés pour accélérer les calculs pendant l'entraînement et l'inférence.

En clair, cette conception vise à offrir des performances élevées tout en optimisant la consommation d'énergie, cruciale pour les applications d'IA. L'une des innovations majeures de cette puce réside dans son intégration de technologies mémoire avancées, qui lui permettent de gérer des charges de travail massives de manière plus efficace que les générations précédentes de processeurs d'AMD. Cette efficacité accrue positionne le MI325X comme une solution intéressante pour les LLM. Sur le modèle Llama de Meta, AMD se targue de performances d'inférence jusqu'à 40 % supérieures aux puces H200 de Nvidia.

BarraCUDA

Nvidia a historiquement dominé le marché des GPU pour l'IA grâce à son écosystème logiciel, centré sur Cuda, qui rend difficile de migrer vers d’autres architectures. Pour tenter de briser cette domination, AMD met également en Cuda son propre environnement logiciel, ROCm, qui se veut une alternative ouverte à Cuda. L'objectif est de faciliter la migration des modèles d'IA vers ses puces, tout en améliorant la compatibilité avec les frameworks open-source les plus utilisés, PyTorch et TensorFlow.

En résumé, pour séduire les centres de données qui cherchent à réduire leurs coûts et à diversifier leurs fournisseurs, la stratégie d'AMD repose sur l’ouverture de l’environnement logiciel et une tarification compétitive, optimisée sur la base du rapport coût/puissance – un facteur crucial pour les opérateurs de centres de données, préoccupés par les coûts énergétiques croissants.

Cependant, Nvidia lancera sa prochaine génération de puces, Blackwell, en début d’année prochaine. Ces nouvelles puces sont destinées à maintenir l'avantage technologique de Nvidia dans le traitement des charges de travail d'IA, un domaine où l'entreprise bénéficie déjà d'une intégration étroite avec les principaux fournisseurs de cloud comme Microsoft et Meta. En conséquence, AMD a également annoncé sa prochaine puce, la MI350, pour 2025, ainsi qu'une feuille de route pour ses futurs processeurs visant à concurrencer directement les innovations de Nvidia.

Lutte épique

En parallèle, AMD continue d'investir dans sa gamme de processeurs Epyc pour serveurs. Les nouveaux processeurs de 5e génération offrent une variété de configurations, allant de puces économiques à faible consommation jusqu'à des modèles haut de gamme destinés aux superordinateurs, mettant en avant leur aptitude à gérer les charges de travail intensives d'IA.

Au total, AMD prévoit que le marché des puces d'IA atteindra 400 milliards de dollars d'ici à 2027. Les difficultés d’Intel et les performances de sa gamme font clairement d’elle le principal rival de Nvidia, si l’on excepte le chinois Huawei.

Pour en savoir plus :

L’essentiel