Delos Intelligence est d’abord l'histoire de deux frères, l'un commercial (Thibaut) et l'autre ingénieur (Pierre), convaincus dès la fin 2022 du potentiel disruptif de l'IA générative « Quand ChatGPT 3.5 est sorti, on s’est appelés immédiatement. On a compris tout de suite qu’il y avait une vraie rupture technologique en cours ». Immédiatement, les deux frères de la Grand’rive quittent leurs emplois respectifs et se retrouvent à Paris. « Nous avons voulu démarrer avec un projet exploratoire pour comprendre les capacités de l’IA générative, ainsi que ses limites ».
Ce premier projet, lancé en janvier 2023, est un journal automatique personnalisé grâce à ChatGPT, Autonews.dev : « En fonction du profil du lecteur (âge, centres d'intérêt, temps accordé à l'actualité), le type de newsletter reçu est différent » explique Thibaut de la Grand’rive, cofondateur de Delos Intelligence. Grâce à un ChatGPT à peine sorti de l'œuf, les deux frères fabriquent des articles à la carte à partir d'informations sélectionnées parmi différents journaux.
« Dans 90% des entreprises, rien n’a été fait »
Convaincus par cette expérience du potentiel de la technologie, les deux frères créent quelques mois plus tard Delos, qu'ils voient alors comme une « société de services spécialisée dans le maniement de ces nouveaux modèles de langage ». Parmi les offres proposées par Delos Intelligence, des services d'audit et de formation auprès des entreprises, qui permettent de mettre en évidence une forte disparité de maturité à l'IA d'une entreprise à l'autre. « En 2023, tout le monde s'est précipité sur les GPTs en pensant que c'était suffisant. Mais dans 90% des cas, rien ou presque n’a été fait, à part utiliser ChatGPT dans un cadre personnalisé et donc absolument pas sécurisé. Dans 5 à 10% des cas, quelques expérimentations ont été lancées, du lancement d’un chatbot à la prise d’un abonnement Copilot ».
Beaucoup de start-up sont apparues et ont disparu aussitôt. « L’IA générative est faussement facile, il est en réalité très difficile d’avoir un business durable sans réelle plus-value technique » estime Thibaut de la Grand'rive. Pour aider ses clients, Delos Intelligence a lancé il y a un mois la suite Cosmos, une plateforme regroupant « les applications d'IA générative dont tout collaborateur du secteur tertiaire a besoin pour améliorer sa productivité ». Aujourd'hui, la suite compte trois applications (un chatbot, un outil d'analyse de documents et un traducteur), un nombre qui passera à douze d’ici à la fin de l'année.
L’outil de traduction de la suite, Cosmos Chat, est par exemple une optimisation de GPT-3.5, qui migrera bientôt vers GPT-4o. L’offre standard de Cosmos s’élève à 25 euros par mois, soit l’équivalent d’un abonnement à la version payante de ChatGPT ou du traducteur Deepl. Pour cette somme, l’utilisateur a accès à 10 000 crédits par mois, soit environ 20 millions de tokens sur GPT-3.5, ou 1 million sur GPT-4.

Fonctionnement des différents outils de la suite Cosmos (Source : Delos Intelligence)
Après le RAG
« Il est nécessaire d'augmenter les modèles de langage pour obtenir des applications d’entreprise robustes » explique Thibaut de la Grand'rive. Pour cela, l'équipe se saisit d'abord de la technologie RAG (Retrieval-Augmented generation). Bien des entreprises se sont d’ailleurs arrêtées à cette étape, où une API à un modèle effectue la génération à partir de bases de données vectorielles issues de leurs fonds documentaires. Mais très vite, les deux frères réalisent que le RAG ne suffira pas à répondre à leurs problématiques : « Le problème du RAG version 2023 est qu’elle est pensée pour aller chercher ponctuellement une information située à un endroit. Or, de nombreuses questions demandent d'aller chercher des informations transverses, ou de compresser des informations présentes sur plusieurs pages. » D’où le travail sur l’étape suivante, le post-RAG.
Dès l'été 2023, les ingénieurs de Delos réfléchissent au « RAG de demain » et aboutissent à ce que Thibaut de la Grand’rive présente désormais comme le « Post-RAG ». Agnostique aux modèles de langage, le Post-RAG peut se fonder sur Mistral Large, Claude, GPT-4o, etc. : « En fonction du type de question qui est posée, notre technologie va appeler une fonction de recherche différente, des agents autonomes vont comprendre en fonction de la question posée la fonction de recherche à appeler ». Grâce à ses outils, Delos ambitionne de proposer une offre complète à ses clients : « A l'heure de l'IA générative, il ne faut pas se réduire à une seule application » explique Thibaut de la Grand’rive : « Nous voulons tout centraliser en un seul abonnement ».
L'ambition de l'entreprise est d'ouvrir en mars 2025 la première marketplace d'applications d'IA générative. « L’idée est de mettre les technologies que nous avons développées, et notamment le Post-RAG, à disposition des développeurs, pour qu’ils puissent fabriquer des applications robustes. Nous voulons créer un écosystème vraiment puissant impulsé par nos technologies ». Thibaut de la Grand’rive observe que « Le passage du RAG au "Post-RAG" est tellement complexe qu’il constitue un vrai frein sur beaucoup de cas d’usage. Faire passer cette étape sera la responsabilité d’une entreprise pure-player comme la nôtre ».
Propos recueillis par Maurice de Rambuteau.
Pour en savoir plus :