L’IA pour de vrai

Jensen Huang présente le plan de marche de Nvidia

« Chaque couche de l’informatique a été transformée (...) Il ne s’agit plus de récupérer des données pour les intégrer à un calcul, mais de faire appel à l’IA pour en générer » : Jensen Huang, hier soir, a fait état d’une vision de l’avenir de la tech assez convaincante. Sauf pour la bourse de New York, inquiète de Donald Trump.

  • DES AGENTS QUI RAISONNENT. La diffusion en un an des modèles de raisonnement et de l’IA agentique a provoqué multiplié les besoins de calcul de l’IAd’un facteur 100”, estimait hier soir Jensen Huang, à l’ouverture de la conférence GTC.
  • Pour favoriser le développement de cette nouvelle IA, qui succède à l’IA générative, Nvidia a présenté le cadre AI-Q Blueprint, qui permet de connecter des bases de connaissance aux agents d’IA.
  • Le groupe a réentrainé la série de modèles open source Llama, de Meta. Les Llama Nemotron sont des modèles de raisonnement 20% plus précis et 5 fois plus rapides que les Llamas dont ils sont issus. Ils seront disponibles sur Microsoft Azure et la plateforme NIM de Nvidia, et des sociétés comme Accenture et ServiceNow les distribueront également. SAP les utilisera pour son assistant Joule et ses solutions SAP Business AI.
  • L'entraînement a été réalisé, en partie, avec les ordinateurs DGX et RTX. Animés par les puces CPU/GPU Grace Blackwell, les DGX sont destinés à concurrencer les Mac haut de gamme d’Apple. Ils seront notamment produits par Dell et HP.
  • DES PUCES EN MARCHE ALTERNÉE. Nvidia contre l’idée que l’apparition de modèles frugaux comme Deepseek réduira l’appétit pour ses puces en proposant Dynamo, un cadre de mutualisation des étapes de raisonnement qui servira, annonce Jensen Huang, « de système d’exploitation pour les usines d’IA », du nom que Nividia donne à ses systèmes intégrés.
  • « DeepSeek a établi une nouvelle base de performance plus basse pour l'IA générative (en particulier pour les modèles de chaîne de pensée/raisonnement), permettant à davantage d'organisations d'expérimenter l'IA. Cela ne devrait pas avoir d'impact immédiat sur Nvidia puisque la demande pour ses GPU dépasse sa capacité à les fournir. À long terme, cela permet à des concurrents comme AMD et Intel de prendre pied sur le segment inférieur du marché de l'infrastructure de l'IA » observe, mi-figue mi-raisin, Alvin Nguyen, analyste chez Forrester.
  • Malgré les problèmes de conception et de fabrication de la puce Blackwell cette année, les plans de passage à un rythme annuel sont maintenus – comme prévu. Blackwell Ultra sera lancée en fin d’année, puis Vera Rubin en 2026, Rubin Ultra en 2027 et Feynman en 2028, mais il faudra que les paris que prend Nvidia en photonique et en réseau s’avèrent gagnants.
  • DES ROBOTS AU VOLANT. Hier, General Motors a rejoint le nombre des constructeurs automobiles qui s’appuient sur Nvidia pour l’avenir de leurs véhicules autonomes et de leurs systèmes d’assistance au conducteur (Adas), comme Mercedes Benz, Toyota, Hyundai, BYD, Rivian… Le constructeur de Detroit prévoit de générer environ 2 milliards de dollars de chiffre d’affaires par à partir de 2030, en louant SuperCruise, l’Adas qu’il a dérivé de la filiale de robotaxis qu’il a fermé l’an dernier (lire Qant du 10 novembre 2023).
  • Walt Disney et Google DeepMind utilisent toutes deux la plateforme Isaac GR00T N1 pour développer de futurs robots humanoïdes.
  • À SURVEILLER : La bourse ou la tech. Le cours de Nvidia a perdu 3,2 % après le discours de Jensen Huang, qui n’a pas affronté les problèmes que pourrait lui causer Donald Trump, ni su donner un second souffle à sa vision de l’avenir. Celle-ci semble pourtant convaincante : alors que la tech achève de basculer dans l’IA, il lui sera difficile de desserrer l’emprise de Nvidia.

L’essentiel