Les agents d’IA nouveaux sont arrivés

"Des super-agents pour l'IA" (Qant, M. de R. avec Midjourney)

L'introduction d'agents d'IA par des acteurs majeurs comme Microsoft, Salesforce, et de nombreuses start-ups marque un tournant dans le monde professionnel. Capables d'interagir entre eux et d'automatiser des tâches complexes, ces agents ouvrent la voie à de nouvelles dynamiques de travail tout en soulevant des questions sur leur intégration et leur coût réel.

Parler c’est bien, agir c’est mieux. Le besoin de dépasser l’IA générative et créer des modèles d’IA capables d’exécuter des décisions s’est fait sentir dès l’an dernier. Le lancement de GPT-4 a ouvert une multitude de perspectives et quelques start-up open source se sont précipitées dans la brèche, comme AutoGPT, AgentGPT ou BabyGPT. Mais, à part quelques coups publicitaires, comme ChaosGPT, un agent “programmé” pour détruire le monde, et le Rabbit de R1 au CES dernier, ces premières initiatives n’ont débouché sur rien. Dix-huit mois plus tard, les choses sont bien différentes.

Une nouvelle génération de start-up a travaillé sur les limitations de ces premiers agents, palliant à leur inexistante capacités de raisonnement, comme l’analyse CB Insights dans le webinaire ci-dessous. Et GPT o1, qui intègre ces remèdes, et notamment les chaînes de raisonnement, pourra servir de chef d’orchestre à architectures multi-agents. La vague gonfle et s’apprête à déferler.

Cette semaine, Microsoft a présenté Copilot Pages, une nouvelle fonctionnalité permettant une collaboration "multijoueur" entre l'humain et l'IA. Destiné aux utilisateurs de Microsoft 365 Copilot, Copilot Pages offre un espace de travail où les équipes peuvent intégrer et modifier en temps réel les réponses générées par le chatbot Copilot. En plus de Copilot Pages, Microsoft introduit des "agents Copilot" pour automatiser les tâches répétitives. Contrairement à un chatbot traditionnel, ces agents, accessibles via Teams ou Outlook, peuvent être configurés pour surveiller les boîtes de réception, organiser des données ou exécuter des actions automatisées. Ces outils visent à optimiser le flux de travail en déchargeant les employés de certaines tâches administratives. Grâce à Copilot Studio, les utilisateurs de Microsoft 365 Copilot peuvent désormais créer facilement leurs propres agents, exploitant ainsi pleinement les informations disponibles dans leurs fichiers SharePoint.

Des agents chez Microsoft … et chez Salesforce

De son côté, Salesforce a lancé cette semaine Agentforce, une nouvelle initiative visant à intégrer des agents IA dans sa plateforme de gestion de la relation client (lire Qant du 18 septembre). En s'appuyant sur sa plateforme prédictive Einstein, déjà utilisée pour les ventes, le service client, le marketing et le commerce (lire Qant du 8 mars 2023), Agentforce promet d'automatiser des tâches complexes en combinant données, agents IA et CRM. Ces agents sont conçus pour assister les employés dans divers domaines, tout en exploitant la puissance des données pour fournir des résultats concrets aux clients de Salesforce. Pour soutenir cette transition, Salesforce utilise sa plateforme Data Cloud, qui intègre des données structurées et non structurées, afin d'alimenter Agentforce.

L’objectif est de fournir un cadre aux entreprises pour personnaliser leurs agents, notamment grâce à des outils comme Prompt Studio. Ainsi, les administrateurs peuvent ajuster les réponses de l'agent en fonction de la voix de la marque de leur entreprise. L'un des éléments centraux d'Agentforce est le moteur de raisonnement Atlas. Ce système évalue les actions et données disponibles pour générer des tâches automatisées en temps réel. Grâce à des techniques avancées, comme la génération augmentée par récupération et la planification hiérarchique, Atlas permet de créer des plans dynamiques répondant aux questions des clients en fonction des informations disponibles et du retour des utilisateurs.

Des effets profonds

L'introduction d'agents d'IA comme ceux de Microsoft ou de Salesforce représente un changement profond dans les interactions digitales professionnelles. Ils automatisent les tâches répétitives et complexes, permettant aux employés de se concentrer sur des fonctions plus stratégiques. Microsoft met également en avant l'importance de la confidentialité des données et de l'utilisation éthique de l'IA. Cependant, la présence croissante de ces agents dans le milieu professionnel pose des défis en termes de passage à l’échelle, d'intégration avec diverses applications et de gestion de l'équilibre entre automatisation et supervision humaine. L'évolution continue de ces agents d'IA pourrait donner naissance à de nouveaux modèles économiques adaptés aux besoins spécifiques de divers secteurs tels que la santé ou la finance. Se pose également la question du coût réel de ces agents, considéré par certaines études comme sous-estimé.

Dès novembre 2023, OpenAI avait présenté, en parallèle du lancement de GPT-Turbo, les GPTs (lire Qant du 7 novembre 2023), des agents génératifs adaptés au besoin de leurs utilisateurs, et disponibles au sein d'un "GPT Store", disponible depuis le début de l’année, et qui sert d’argument de poids à OpenAI pour pousser ses clients à souscrire à un abonnement premium, qui donne accès à ce “magasin” d’agents IA. Depuis, les "agents d'IA" se sont multipliés, nécessitant de rappeler ce que l'on entend réellement par agent IA, à savoir une IA capable d'interagir avec son environnement, de collecter des données et d'utiliser ces dernières pour effectuer des tâches autodéterminées pour accomplir un objectif qui lui a été donné.

Quand les agents travaillent avec les agents

Les agents d'IA sont également devenus capables de travailler de concert. Une équipe de chercheurs menée par Junlin Wang a notamment présenté une structure intitulée Mixture-of-Agents (MoA), où plusieurs agents LLM travaillent ensemble par couches successives. Chaque agent utilise les sorties des agents de la couche précédente comme information auxiliaire pour générer ses réponses. Cette approche permet de combiner les forces de plusieurs LLM, même si certains modèles individuels sont moins performants que d'autres. Les résultats montrent que cette méthode surpasse les performances de GPT-4 Omni sur plusieurs benchmarks. Depuis, le lancement de GPT o1 ouvre de nouvelles perspectives à cette architecture multi-agents.

L'approche MoA est structurée en plusieurs couches, chaque couche comprenant plusieurs agents qui génèrent des réponses indépendantes à un même prompt. Les réponses sont ensuite raffinées par les agents des couches suivantes, créant ainsi un processus itératif d'amélioration. Cette collaboration entre LLM repose sur deux critères principaux : les métriques de performance et la diversité des modèles. En sélectionnant soigneusement les modèles pour chaque couche, MoA parvient à atténuer les faiblesses individuelles et à produire des réponses plus complètes et robustes. Les tests effectués montrent une amélioration significative de la qualité des réponses, avec une augmentation du taux de réussite sur AlpacaEval 2.0 de 57,5% à 65,1%.

Préparer l’avenir

Bien des start-up préparent, sur des plateformes comme Langchain, des agents destinés à automatiser les workflows d’entreprise et succéder à l’automatisation des processus (RPA). Au début de l'été, par exemple, Hebbia AI, une start-up new-yorkaise spécialisée dans l'IA pour la finance, qui levait 130 millions de dollars, valorisant l'entreprise à environ 700 millions de dollars (lire Qant du 11 juillet). Le principal produit d'Hebbia AI, Matric, permet aux entreprises financières de créer des agents d'IA autonomes, charger d'effectuer diverses tâches dans des bases de données et des fonds documentaires.

Mais c’est dans la génération de code, ou plutôt la création de logiciels, que les perspectives semblent les plus puissantes. C'est par exemple le cas de la californienne Magic. Le scepticisme avec lequel elle a été accueillie en février dernier lors de la présentation de son assistant d'IA pour la recherche et la génération de code (lire Qant du 21 mars) a été balayé quand elle a levé 320 millions de dollars (environ 295 M€) au début du mois de septembre.

La start-up londonienne Cognition Labs, qui a lancé au printemps son assistant de codage Devin (lire Qant du 14 mars), vise elle valorisation allant jusqu'à 2 milliards de dollars. Devin, capable de réaliser de manière autonome des tâches de codage complexes, est présenté comme susceptible d'automatiser entièrement le développement logiciel.

La vision des agents d'IA, capables de programmer la machine pour accomplir des instructions en langage naturel, se dessins ainsi derrière la vague des agents d’IA. Bill Gates, qui la décrit depuis les années 1980, doit pouvoir se réjouir (lire Qant du 16 novembre 2023).

Pour en savoir plus :

L’essentiel