De prime abord, OpenAI fait feu de tout bois, rouvrant les négociations avec Apple pour intégrer ChatGPT à l’iPhone 16 et recevant à grand bruit le premier H200 de Nvidia. Cette nouvelle GPU est présentée comme 110 fois plus rapide que le H100 pour le calcul à haute performance et 1,5 à 2 fois plus rapide pour l’inférence des modèles d’IA. En réalité, l’entreprise s’attache surtout à se protéger sur le front du droit d’auteur et à déployer sa stratégie d’agents, qui prendront la relève de l’IA générative.
Hier, le Financial Times a conclu un accord avec OpenAI pour la licence de son contenu et le développement d'outils d'IA. Ce partenariat permettra aux utilisateurs de ChatGPT d'accéder à des résumés, citations et liens vers des articles du FT. En échange, OpenAI collaborera avec le journal pour créer de nouveaux produits d'IA.
Rompre le front des médias
Pour l’entreprise de Sam Altman, il s’agit d’un nouveau média qui tombe dans son escarcelle. Mi-mars, OpenAI avait annoncé un accord similaire avec le journal Le Monde ainsi qu'avec l'espagnol Grupo Prisa, propriétaire de El Pais (lire Qant du 14 mars). En 2023, c'est l'agence Associated Press en juillet, puis le groupe allemand Axel Springer (Bild Zeitung, Die Welt, Business Insider, Politico) qui avaient signé de tels accords (lire Qant du 14 décembre 2023).
Le chiffre d'une rémunération par OpenAI d'Axel Springer à hauteur de plusieurs dizaines de millions d'euros par an avait été évoqué au moment de l'annonce du partenariat. Un chiffre semblable à la valeur extraite par Reddit de la cession de ses données à Google au moment de la préparation de son IPO : 60 millions de dollars (lire Qant du 20 février).
De quoi relativiser les inquiétants procès pour violation du droit d’auteur lors de l’entraînement de GPT-4. Outre des auteurs de renom comme George Martin, auteur de Game of Thrones, le New York Times a porté plainte contre OpenAI et Microsoft en montrant que GPT-4 pouvait générer des articles identiques à ceux du journal, simplement en en saisissant une partie (lire Qant du 8 janvier).
Tout un magasin de vecteurs pour créer des agents
En parallèle, OpenAI vient de renforcer considérablement ses agents d’IA, baptisés Assistants ou GPTs. Chacun peut désormais interroger jusqu’à 10 000 fichiers, contre 20 précédemment, avec de nouvelles fonctionnalités de gestion des requêtes et des fichiers dans les vector stores. Cette mise à jour permet également des requêtes parallèles, une meilleure réorganisation des résultats, la réécriture de requêtes et des réponses conversationnelles en temps réel.
La semaine dernière, OpenAI a en effet annoncé de multiples améliorations à son API. Concernant la sécurité, les nouvelles fonctionnalités incluent une liaison privée qui assure une communication directe et sécurisée entre les services cloud de Microsoft Azure et OpenAI, pour réduire l'exposition des données des clients sur l'internet public.
Autre ajout notable, Batch API offre des tarifs réduits pour les charges de travail consistant en un niveau constant d'utilisation de jetons par minute. Cette fonction est particulièrement adaptée aux tâches qui ne nécessitent pas de réponses immédiates des modèles IA, permettant ainsi une réduction de 50% des coûts pour les travaux asynchrones.
750 agents pour un nouveau vaccin
Le fabricant de vaccins Moderna a créé 750 de ces assistants, pour accélérer le développement de nouveaux produits à partir de sa plateforme d’ARN messager, maintenant que les ventes de vaccins anti-Covid décroissent rapidement. Les GPTs permettent par exemple de choisir les doses optimales ; ils préparent aussi les brouillons des réponses aux questions des régulateurs.
Autre exemple, Website Generator est un GPT optimisé pour la création de sites Web, qui fait appel à GPT-4 et Dall-e, en partenariat avec B12.io. Au fur et à mesure que les modèles concurrents, Claude, Gemini et Llama, se rapprochent du niveau de GPT-4, OpenAI mise sur ces agents spécialisés pour préserver son avance.
Sans même attendre GPT-5.
Pour en savoir plus :